谷歌发布2025 AI年度总结:哈萨比斯Jeff Dean联手执笔

2025-12-25 10:23
100
谷歌由哈萨比斯(DeepMind CEO)和Jeff Dean(谷歌AI负责人)牵头,发布了年度AI总结报告——没有堆砌概念,全是硬核成果:Gemini 3系列霸榜全球基准测试,AI拿下国际数学竞赛金牌,AlphaFold服务300万科研人员,甚至靠量子研究斩获诺贝尔奖。以下是全文翻译:


Google 2025年度回顾:8大领域的研究突破

2025年12月23日
这一年是AI智能体、推理能力和科学发现突飞猛进的一年。
2025年是研究领域取得非凡进展的一年。随着人工智能的发展,我们看到它的轨迹正从一种“工具”转变为一种“公用设施”:从人们使用的东西变成了可以为人们工作的东西。如果说2024年是为这一时代奠定多模态基础的一年,那么2025年则是AI开始真正思考、行动并与我们一起探索世界的一年。在量子计算方面,我们在实际应用方面取得了进展。纵观全局,我们帮助将研究转化为现实,推出了更强大、更有用的产品和工具,对人们当下的生活产生积极影响。
以下是Google、Google DeepMind和Google Research在这充满不懈进步的一年中所取得的一些突破、产品发布和科学里程碑的回顾。
1.在世界级模型上实现突破
今年,我们在推理、多模态理解、模型效率和生成能力方面取得了重大突破,显著提升了模型能力。这一进程始于3月发布的Gemini 2.5,并在11月Gemini 3和12月Gemini 3 Flash的发布中达到高潮。
Gemini 3 Pro建立在最先进的推理基础之上,是我们迄今为止最强大的模型,旨在帮助你实现任何想法。它在LMArena排行榜上名列前茅,并在Humanity’s Last Exam(一项旨在测试AI是否能像人类一样真正思考和推理的极高难度测试)和GPQA Diamond等基准测试中取得了突破性高分,重新定义了多模态推理。它还为前沿模型在数学领域树立了新标准,在MathArena Apex上达到了23.4%的新高。随后我们推出了Gemini 3 Flash,它结合了Gemini 3 Pro级的推理能力与Flash级的低延迟、高效率和低成本,使其成为同等规模下性能最强的模型。Gemini 3 Flash的质量超越了我们之前的Gemini 2.5 Pro级模型,而价格却只有其一小部分,延迟也大幅优化,延续了我们Gemini时代的趋势:“下一代的Flash模型优于上一代的Pro模型”。
我们致力于通过最先进的开放模型让有用的AI技术触手可及。我们构建了Gemma系列模型,使其轻量化并开放供公众使用;今年我们引入了多模态能力,显著增加了上下文窗口,扩展了多语言能力,并提高了效率和性能。
2.利用AI创新和变革产品
整个2025年,我们继续推动AI从工具向公用设施的转变,利用强大的新智能体能力(agentic capabilities)彻底改变了我们的产品组合。我们重塑了软件开发,不再局限于辅助编码的工具,而是引入了与开发者协作的强大智能体系统。其中的关键进展,例如Gemini 3令人印象深刻的编码能力以及Google Antigravity的发布,标志着AI辅助软件开发进入了一个新时代。
这种演变在我们的核心产品中也显而易见,从Pixel 10上的AI功能和Search(搜索)中AI Mode的更新,到Gemini app和NotebookLM等AI优先的创新产品(后者获得了Deep Research等高级功能)。

3.赋能创意与AI共创
2025年对于生成式媒体来说是变革性的一年,它赋予了人们前所未有的新能力来实现他们的创意抱负。用于视频、图像、音频和虚拟世界的生成式媒体模型和工具变得更加有效并被广泛使用。其中,爆款产品Nano Banana和Nano Banana Pro为原生图像生成和编辑提供了前所未有的能力。我们与创意产业人士合作开发了Flow和Music AI Sandbox等工具,使其对创意工作流更有帮助。我们在Google Arts&Culture实验室推出了新的AI驱动体验,在Gemini应用中对图像编辑进行了重大升级,并推出了Veo 3.1、Imagen 4和Flow等强大的新生成式媒体模型,从而扩展了人们的创意可能性。
随着研究突破不断扩展AI的能力,Google Labs成为了我们在开发过程中分享AI实验的地方——倾听用户反馈并在学习中进化。今年Labs中一些最吸引人的实验包括:Pomelli,一个用于制作符合品牌调性的营销内容的AI实验;Stitch,引入了一种在几分钟内将提示词和图像输入转化为复杂UI设计和前端代码的方法;Jules,一个充当开发者合作伙伴的异步编码智能体;以及Google Beam,一个利用AI推进远程呈现可能性的3D视频通信平台。
4.推进科学与数学
2025年也是AI推动科学进步的丰收年,我们在生命科学、健康、自然科学和数学领域均取得了突破。
在这一年里,我们在构建AI资源和工具方面取得了进展,这些工具赋能研究人员,帮助他们在医疗健康领域理解、识别和开发治疗方法。在基因组学领域(我们已将先进技术应用于该领域研究长达10年),我们超越了测序,利用AI来解读最复杂的数据。我们还迎来了AlphaFold的5周年纪念,这个获得诺贝尔奖的AI系统解决了困扰科学界50年的蛋白质折叠问题。AlphaFold已被190多个国家的300多万研究人员使用,其中包括中低收入国家的100多万用户。
Gemini先进的思维能力(包括Deep Think)也推动了数学和编码领域的历史性进展。Deep Think能够解决需要深度抽象推理的问题——在两项国际竞赛中达到了金牌标准。

5.塑造计算与物理世界的创新
我们也正在引领重大发现,并在量子计算、能源和“登月计划”等领域塑造科学的未来。这一领域的研究吸引了前所未有的公众关注,正如Quantum Echoes所展示的那样,我们在量子计算的实际应用方面取得了进展。值得注意的是,Google员工Michel Devoret与前Google员工John Martinis以及加州大学伯克利分校的John Clarke因其20世纪80年代的基础性量子研究,共同获得了2025年诺贝尔物理学奖。
2025年,我们继续推进支撑我们AI的核心基础设施,专注于硬件设计的突破和能源效率的提升。这包括推出了Ironwood,这是一款为推理时代打造的新型TPU,它是利用一种名为AlphaChip的方法设计的。同时,我们也致力于衡量我们技术的环境影响。
我们在机器人和视觉理解方面的工作将AI智能体带入了物理和虚拟世界,其中包括基础性的Gemini Robotics模型、更复杂的Gemini Robotics 1.5,以及作为通用世界模型新前沿的Genie 3的推出。
6.应对全球挑战与机遇
我们在2025年的工作表明,AI驱动的科学进步正被直接应用于解决世界上最关键和普遍的挑战。通过利用最先进的基础模型和智能体推理,我们正在显著加深对地球及其系统的理解,同时在气候适应能力、公共卫生和教育等对人类繁荣至关重要的领域提供有影响力的解决方案。
例如,我们正在使用最先进的基础模型和智能体推理来帮助加深对地球的理解,从而赋能那些正在改善人们当下生活的工作,从天气预报到城市规划再到公共卫生。例如,我们的洪水预报信息现在覆盖了150个国家超过20亿人,用于预警严重的河流洪水。我们最先进、最高效的预报模型WeatherNext 2生成预报的速度快了8倍,分辨率高达1小时。利用这项技术,我们通过实验性的气旋预测支持气象机构基于一系列情景做出决策。
我们正在与合作伙伴合作,将AI驱动的科学进步应用到更贴近患者的地方,开辟疾病管理和治疗发现的新途径。
AI正被证明是教育领域的强大工具,通过LearnLM和Gemini中的Guided Learning(引导式学习)等计划,它实现了新的理解形式并拓展了好奇心。我们将Gemini最强大的翻译能力带到了Google翻译中,实现了更智能、更自然、更准确的翻译,并试点了新的语音到语音翻译功能。
7.优先考虑责任与安全
我们将研究突破与严谨且前瞻性的责任和安全工作相结合。随着我们的模型能力越来越强,我们不断推进和演变我们的工具、资源和安全框架,以预测和减轻风险。Gemini 3展示了这一方法的实际应用:它是我们迄今为止最安全的模型,并经历了Google所有AI模型中最全面的安全评估。我们还在向更远处展望,探索通往AGI的负责任路径,优先考虑准备工作、主动风险评估以及与更广泛的AI社区合作。
8.引领与行业、学术界和公民社会的边际合作
负责任地推进AI前沿需要社会各界的合作。2025年,我们与领先的AI实验室合作,协助成立了Agentic AI Foundation(智能体AI基金会),并支持开放标准以确保智能体AI拥有一个负责任且可互操作的未来。在教育方面,我们与迈阿密戴德县等学区以及Raspberry Pi等教育团体合作,为学生提供AI技能。我们与加州大学伯克利分校、耶鲁大学、芝加哥大学等多所大学的研究合作伙伴关系,对今年一些最令人兴奋的前沿研究起到了关键作用。我们还与美国能源部的17个国家实验室合作,改变科学研究的进行方式。此外,我们正在与电影制作人和其他富有远见的创意人士合作,将最好的AI工具交到他们手中,探索AI时代的叙事方式。
展望未来
当我们展望2026年时,我们期待继续安全、负责任地推进前沿技术,造福人类。
0
好文章,需要你的鼓励