豆包最新版本叫什么?刚更新的豆包1.8,有点东西
2025-12-18 17:37
193
12月18日,豆包更新了最新版本1.8,有点东西的。
先简单介绍一下吧。
1)更强的Agent能力 新一代模型,大幅增强了工具调用(Tool use)能力,比如Search、Computer use、Browser use等,擅长执行复杂的任务规划和流程理解。 同时,它的Coding能力也有所提升,相信你已在开篇的2个前端case中看到。 而且,它的长文和多轮指令遵循也有所提升。在benchmark中,相比上一代模型有大幅提升。 所以,这是一个非常适合复杂场景的企业级Agent部署的模型。
2)更精准的多模态理解 同Gemini 3 Pro、GLM-4.6V一样,豆包1.8的多模态理解能力这次也得了显著增强。 尤其是视觉理解方面,不仅视觉理解的Tokens消耗更少,同步还理解精度更高,单次视频理解帧数从640帧提升至1280帧。 同时,思考长度也支持自调节,各模式下思考更精简,Tokens更节省。
3)更灵活的上下文管理 上下文窗口支持256k,尤其擅长超长文本处理、复杂/多步流程任务。 据官方介绍,豆包1.8是国内首个支持原生API进行上下文管理的模型,仅需API传参就可以灵活清理上下文,减少输入tokens,大幅降低成本。 中译中就是,豆包1.8把上下文管理从开发者的负担,直接变成了模型API自带的能力,既省tokens,又省开发工程。
一句话总结:豆包1.8在模型层面做了很多“工程友好性”的事情,同时也大幅优化了自身在多模态、Agentic方面的能力,非常适合企业级Agent的部署。
豆包1.8实测
下面,我们来看实测案例。 上海世博中心旁边500米的地方,有一个标志性的斗拱建筑,叫「中国馆」。 它以“斗冠”为形,配以“中国红”,形成了独特的东方之冠。

我用刚刚发布的豆包1.8模型复刻了一下,长这样。 提示词:参照中国馆.jpg的外观造型,用Three.js构建一个可交互的【上海世博园·中国馆】的3D页面。

几乎是完全还原,模拟了中国馆的倒梯形结构。 这版豆包的coding能力很强,比如我做的这个3D中国馆,效果就很惊艳。 这次,豆包大模型直接从1.6跳到了1.8。 这背后,不难看出字节对这一模型的重视。
多模态+Agent有没有得搞?肯定有得搞,企业要把AI从Demo搬进产线,这是绕不过的基座选择。 而字节,一直擅长在性能、价格和速度之间交付最均衡的模型,豆包1.8就是如此。 更关键的是他们的战略姿态:喊All in AI,就真的All in,不扭扭捏捏,不左右互搏。 在新旧交替的窗口期,方向比速度更重要。
0
好文章,需要你的鼓励
