Skip to content

2025.12.17全球AI新闻速递

· 6 min

过去4小时全球AI要闻回顾#

OpenAI Images 1.5 正式发布,提升图像生成与编辑能力#

OpenAI正式发布了Images 1.5图像生成模型,现已在ChatGPT和API中上线。该版本在图像质量、生成速度和编辑能力方面均有显著提升,并提供了在ChatGPT中轻松创建趣味图像的新方式。OpenAI CEO Sam Altman表示,这是他们今天推出的“非常有趣”的新功能。

OpenAI Images 1.5 正式发布,提升图像生成与编辑能力

GPT 5.2 Pro 获用户高度评价,被视为“范式转变”#

OpenAI CEO Sam Altman转发的用户反馈显示,GPT 5.2 Pro在实际应用中带来了“范式转变”,特别是在代数几何和数论研究等需要长时间工作的领域,其实用性有了显著提升。Sam Altman强调这是一项“重要的新评估”,表明该模型在复杂任务处理能力上的突破。

GPT 5.2 Pro 获用户高度评价,被视为“范式转变”

Google创始人谢尔盖·布林斯坦福演讲:回顾Google历史,展望AI未来,强调材料科学与分子生物学潜能#

Google创始人谢尔盖·布林在斯坦福工程学院百年庆典上发表了深度演讲,回顾了Google的起源,分享了公司在Transformer和Google Glass项目上的经验教训,强调了信任技术人员和早期投入基础研究的重要性。布林对AI的未来持乐观态度,认为其能增强个人能力,并提出需要重新思考大学教育的意义。他还特别指出,材料科学和分子生物学是被低估的颠覆性技术。

Google创始人谢尔盖·布林斯坦福演讲:回顾Google历史,展望AI未来,强调材料科学与分子生物学潜能

小米发布MiMo-V2-Flash开源MoE模型,速度与性能兼备#

小米发布了全新的开源MoE模型MiMo-V2-Flash,总参数达309B,推理速度高达150 tokens/s。该模型采用了混合滑动窗口注意力机制,并基于27T tokens数据进行FP8混合精度训练。MiMo-V2-Flash在多个基准测试中展现出与K2/DSV3.2竞争的强大实力,参数量更少,且专为Agentic AI设计。

小米发布MiMo-V2-Flash开源MoE模型,速度与性能兼备

Molmo 2 在图像和视频任务中刷新开放模型SOTA#

Molmo 2在开放模型中的图像和视频任务上取得了新的SOTA(State-of-the-Art)成果。该模型基于SigLIP2和Qwen3构建,提供三种不同尺寸,并包含一个专门用于视频指向/计数的4B模型。Molmo 2采用Apache 2.0许可证,其图像和视频数据集也已同步发布。

Molmo 2 在图像和视频任务中刷新开放模型SOTA

MSL 发布全新开放音频模型 SAM Audio#

MSL(Microsoft Speech and Language)发布了新的开放音频模型SAM Audio。该模型的发布旨在进一步推动音频领域AI技术的进步和应用,为研究人员和开发者提供更多工具。

MSL 发布全新开放音频模型 SAM Audio

腾讯推出HY World 1.5 (WorldPlay) 世界模型,具备实时交互和长期记忆能力#

腾讯推出了其最新的世界模型HY World 1.5 (WorldPlay),该模型具备实时交互和长期记忆能力,旨在为用户提供更沉浸和动态的体验,预示着在虚拟世界和Agentic AI应用方面的新进展。

腾讯推出HY World 1.5 (WorldPlay) 世界模型,具备实时交互和长期记忆能力

Google AI生产力工具更新:Gmail新增CC代理,Gemini App升级深度研究功能#

Google Labs推出了新的实验性AI生产力代理CC,作为Gmail的一部分,能够为用户提供每日简报。此外,Gemini App也升级了其“深度研究”功能,使用户在学习新主题时能更直观地看到相关信息和图片,提升学习体验。

Google AI生产力工具更新:Gmail新增CC代理,Gemini App升级深度研究功能

Claude Code 更新多项功能,提升开发体验#

Claude Code更新多项功能,提升开发体验。

Claude Code 更新多项功能,提升开发体验