豆包
中文环境下高性价比的多模态AI助手
网站版
文本生成
问答助手
代码编写
图像生成
视频生成
豆包(Doubao)是字节跳动于2023年8月推出的多模态 AI 聊天助手,支持中文为主的多语言对话、内容创作、编程辅助、图文音视频生成、智能搜索与 PDF 问答等功能。其领先的视觉语言模型(Seed-Visual‑LLM)搭载图像识别、语音交互、视频生成与逻辑推理能力,在推理能力上已与 GPT‑4o、Claude 3.5 相当,并以约 1/8 成本提供服务。平台用户规模广泛,国内月活用户超过 5000 万,国外版本 Cici 支持 18 种语言。豆包结合创新的“Think while you search”检索加推理模式,以及文案创作、数据分析、会议整理等办公辅助工具,在内容创作者、学生、职场人士中获得广泛使用。

工具介绍
功能特性
- 支持文本、图像、语音、视频等多模态输入与生成,具备端到端低延迟语音对话和随时打断能力。
- 集成视觉理解、逻辑推理、代码生成、文档解析及256K长上下文处理,可基于图片或手绘草图生成代码并自动修复样式。
- 提供AI写真、音乐生成、视频创作(含动态海报)、同声传译及方言识别等特色功能。
应用场景
- 内容创作:生成文案、故事、诗歌、海报及短视频脚本,支持图文结合与多风格图像输出。
- 学习辅导:解答学科问题、生成学习计划、模拟英语陪练,支持拍题解题与知识点讲解。
- 办公提效:自动生成会议纪要、翻译文档、编写与调试代码、处理PDF及数据分析。
- 生活服务:旅行规划、健身指导、恋爱建议、家电维修指导及农村实用文书撰写。
适用人群
- 内容创作者、学生、职场人士及中小企业主,尤其适合非技术背景的日常高频使用。
- 覆盖从一线城市到县域乡村的广泛用户,包括需方言交互的老年群体及教育资源薄弱地区家庭。
定价方式
- 基础功能完全免费,高级功能如编程模型(Doubao-Seed-Code)提供订阅制套餐,首月9.9元起,综合成本较行业平均低62.7%。
支持语言
- 支持中文(含粤语、东北话等6大方言)、英语、日语、韩语、德语、法语、西班牙语、葡萄牙语、印尼语等共28种语言互译。
技术亮点
- 基于字节自研多模态大模型Doubao-1.5/1.6系列,采用大规模稀疏MoE架构,在数学、代码、专业知识等任务上超越GPT-4o。
- 视觉理解模型Doubao-vision在十多个主流数据集上比肩Gemini 2.0与GPT-4o,推理成本仅为后者1/8。
使用方式
- 支持网页端(doubao.com)、iOS/Android App、Windows/Mac客户端及豆包浏览器插件,亦可通过火山引擎API集成至企业系统。
更新记录
- 2025年6月发布1.6版本,强化深度思考模式,支持256K上下文及多模态输入,高考数学测试得分144分。
- 2025年4月上线1.5深度思考视觉版,增强视频理解与空间推理能力,并推出文生图3.0支持2K高清生成。
用户评分
4.2
3人点评
我要评分
