豆包最新版本叫什么？刚更新的豆包1.8，有点东西

2025-12-18 17:37

193

12月18日，豆包更新了最新版本1.8，有点东西的。

先简单介绍一下吧。

1）更强的Agent能力新一代模型，大幅增强了工具调用（Tool use）能力，比如Search、Computer use、Browser use等，擅长执行复杂的任务规划和流程理解。同时，它的Coding能力也有所提升，相信你已在开篇的2个前端case中看到。而且，它的长文和多轮指令遵循也有所提升。在benchmark中，相比上一代模型有大幅提升。所以，这是一个非常适合复杂场景的企业级Agent部署的模型。

2）更精准的多模态理解同Gemini 3 Pro、GLM-4.6V一样，豆包1.8的多模态理解能力这次也得了显著增强。尤其是视觉理解方面，不仅视觉理解的Tokens消耗更少，同步还理解精度更高，单次视频理解帧数从640帧提升至1280帧。同时，思考长度也支持自调节，各模式下思考更精简，Tokens更节省。

3）更灵活的上下文管理上下文窗口支持256k，尤其擅长超长文本处理、复杂/多步流程任务。据官方介绍，豆包1.8是国内首个支持原生API进行上下文管理的模型，仅需API传参就可以灵活清理上下文，减少输入tokens，大幅降低成本。中译中就是，豆包1.8把上下文管理从开发者的负担，直接变成了模型API自带的能力，既省tokens，又省开发工程。

一句话总结：豆包1.8在模型层面做了很多“工程友好性”的事情，同时也大幅优化了自身在多模态、Agentic方面的能力，非常适合企业级Agent的部署。

豆包1.8实测

下面，我们来看实测案例。上海世博中心旁边500米的地方，有一个标志性的斗拱建筑，叫「中国馆」。它以“斗冠”为形，配以“中国红”，形成了独特的东方之冠。

我用刚刚发布的豆包1.8模型复刻了一下，长这样。提示词：参照中国馆.jpg的外观造型，用Three.js构建一个可交互的【上海世博园·中国馆】的3D页面。

几乎是完全还原，模拟了中国馆的倒梯形结构。这版豆包的coding能力很强，比如我做的这个3D中国馆，效果就很惊艳。这次，豆包大模型直接从1.6跳到了1.8。这背后，不难看出字节对这一模型的重视。

多模态+Agent有没有得搞？肯定有得搞，企业要把AI从Demo搬进产线，这是绕不过的基座选择。而字节，一直擅长在性能、价格和速度之间交付最均衡的模型，豆包1.8就是如此。更关键的是他们的战略姿态：喊All in AI，就真的All in，不扭扭捏捏，不左右互搏。在新旧交替的窗口期，方向比速度更重要。

好文章，需要你的鼓励