过去4小时全球AI要闻回顾#

OpenAI Images 1.5 正式发布，提升图像生成与编辑能力#

OpenAI正式发布了Images 1.5图像生成模型，现已在ChatGPT和API中上线。该版本在图像质量、生成速度和编辑能力方面均有显著提升，并提供了在ChatGPT中轻松创建趣味图像的新方式。OpenAI CEO Sam Altman表示，这是他们今天推出的“非常有趣”的新功能。

OpenAI Images 1.5 正式发布，提升图像生成与编辑能力

GPT 5.2 Pro 获用户高度评价，被视为“范式转变”#

OpenAI CEO Sam Altman转发的用户反馈显示，GPT 5.2 Pro在实际应用中带来了“范式转变”，特别是在代数几何和数论研究等需要长时间工作的领域，其实用性有了显著提升。Sam Altman强调这是一项“重要的新评估”，表明该模型在复杂任务处理能力上的突破。

GPT 5.2 Pro 获用户高度评价，被视为“范式转变”

Google创始人谢尔盖·布林斯坦福演讲：回顾Google历史，展望AI未来，强调材料科学与分子生物学潜能#

Google创始人谢尔盖·布林在斯坦福工程学院百年庆典上发表了深度演讲，回顾了Google的起源，分享了公司在Transformer和Google Glass项目上的经验教训，强调了信任技术人员和早期投入基础研究的重要性。布林对AI的未来持乐观态度，认为其能增强个人能力，并提出需要重新思考大学教育的意义。他还特别指出，材料科学和分子生物学是被低估的颠覆性技术。

Google创始人谢尔盖·布林斯坦福演讲：回顾Google历史，展望AI未来，强调材料科学与分子生物学潜能

小米发布MiMo-V2-Flash开源MoE模型，速度与性能兼备#

小米发布了全新的开源MoE模型MiMo-V2-Flash，总参数达309B，推理速度高达150 tokens/s。该模型采用了混合滑动窗口注意力机制，并基于27T tokens数据进行FP8混合精度训练。MiMo-V2-Flash在多个基准测试中展现出与K2/DSV3.2竞争的强大实力，参数量更少，且专为Agentic AI设计。

小米发布MiMo-V2-Flash开源MoE模型，速度与性能兼备

Molmo 2 在图像和视频任务中刷新开放模型SOTA#

Molmo 2在开放模型中的图像和视频任务上取得了新的SOTA（State-of-the-Art）成果。该模型基于SigLIP2和Qwen3构建，提供三种不同尺寸，并包含一个专门用于视频指向/计数的4B模型。Molmo 2采用Apache 2.0许可证，其图像和视频数据集也已同步发布。

Molmo 2 在图像和视频任务中刷新开放模型SOTA

MSL 发布全新开放音频模型 SAM Audio#

MSL（Microsoft Speech and Language）发布了新的开放音频模型SAM Audio。该模型的发布旨在进一步推动音频领域AI技术的进步和应用，为研究人员和开发者提供更多工具。

MSL 发布全新开放音频模型 SAM Audio

腾讯推出HY World 1.5 (WorldPlay) 世界模型，具备实时交互和长期记忆能力#

腾讯推出了其最新的世界模型HY World 1.5 (WorldPlay)，该模型具备实时交互和长期记忆能力，旨在为用户提供更沉浸和动态的体验，预示着在虚拟世界和Agentic AI应用方面的新进展。

腾讯推出HY World 1.5 (WorldPlay) 世界模型，具备实时交互和长期记忆能力

Google AI生产力工具更新：Gmail新增CC代理，Gemini App升级深度研究功能#

Google Labs推出了新的实验性AI生产力代理CC，作为Gmail的一部分，能够为用户提供每日简报。此外，Gemini App也升级了其“深度研究”功能，使用户在学习新主题时能更直观地看到相关信息和图片，提升学习体验。

Google AI生产力工具更新：Gmail新增CC代理，Gemini App升级深度研究功能

Claude Code 更新多项功能，提升开发体验#

Claude Code更新多项功能，提升开发体验。

Claude Code 更新多项功能，提升开发体验