字节跳动发布豆包 1.5 深度思考模型，具备“看图思考”能力

AI技术专栏作家 | 发布了 246 篇文章

IT之家 4 月 17 日消息，在今日火山引擎 AI 创新巡展杭州站现场，字节跳动旗下火山引擎总裁谭待发布了最新的豆包 1.5・深度思考模型。

据介绍，该模型在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出。数学推理 AIME 2024 测试得分追平 OpenAI o3-mini-high，编程竞赛和科学推理测试成绩也接近 o1。在创意写作、人文知识问答等通用任务上，模型也展示出优秀的泛化能力，能胜任更广泛的使用场景。

技术报告显示，该模型采用 MoE 架构，总参数 200B，激活参数为 20B，低于业界同类模型参数规模的 50%，具备显著的推理成本优势。豆包模型 API 服务在保障高并发的同时，延迟低至 20 毫秒。

谭待在会上详细介绍了豆包 1.5 深度思考模型的强大功能。该模型能够结合视觉理解技术提供更多功能，例如根据照片分析地貌，或在旅行时辅助点餐、完成企业项目管理流程图。

此外，豆包文生图模型 Seedream3.0 也正式向企业开放。该模型已在即梦 AI、豆包产品上线，并在近期登上权威竞技场 Artificial Analysis 文生图榜单第一梯队。Seedream3.0 支持 2K 分辨率直出，生图结构准确性、小字生成与排版、美感、真实度等方面具有优势。

值得关注的是，新模型的视频搜索能力也更强，模型能够根据用户搜索问题在视频中寻找相应答案。

同时IT之家注意到，谭待表示，豆包大模型使用量持续高速增长。截至 2025 年 3 月，豆包大模型日均 tokens 使用量超 12.7 万亿，较发布之初增长超 106 倍。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

登录账号

字节跳动发布豆包 1.5 深度思考模型，具备“看图思考”能力

AI前线

评论 (128)

AI爱好者

开发者小明

AI前线作者

科技观察家

文章章节

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

速抢（2核2G）77元/年香港免备案服务器

发布即开放：百度猎户座葫芦里卖的什么药？

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

小鹏物理AI的尽头，是马斯克的现金流

热门标签

热门作者

AI前沿

机器学习实验室

AI创业圈

登录账号

字节跳动发布豆包 1.5 深度思考模型，具备“看图思考”能力

AI前线

评论 (128)

AI爱好者

开发者小明

AI前线 作者

科技观察家

文章章节

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

速抢（2核2G）77元/年香港免备案服务器

发布即开放：百度猎户座葫芦里卖的什么药？

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

小鹏物理AI的尽头，是马斯克的现金流

热门标签

热门作者

AI前沿

机器学习实验室

AI创业圈

AI前线作者