Midjourney操作界面

百度重磅开源文心大模型 4.5 系列,国内大模型市场再掀波澜!

4.8
0热度

近日,百度正式宣布开源其文心大模型4.5系列,共推出了十款模型,包括47B、3B 激活参数的混合专家(MoE)模型,以及0.3B 参数的稠密型模型。此次开源不仅实现了预训练权重的完整公开,还提供了推理代码,标志着百度在大模型领域的重大进展。这些新发布的模型可以在飞桨星河社区、Hugging Face 等平台上下载和部署,同时,百度智能云千帆大模型平台也提供了相应的 API 服务。这一举措使百度成为

近日,百度正式宣布开源其文心大模型4.5系列,共推出了十款模型,包括47B、3B 激活参数的混合专家(MoE)模型,以及0.3B 参数的稠密型模型。此次开源不仅实现了预训练权重的完整公开,还提供了推理代码,标志着百度在大模型领域的重大进展。

这些新发布的模型可以在飞桨星河社区、Hugging Face 等平台上下载和部署,同时,百度智能云千帆大模型平台也提供了相应的 API 服务。这一举措使百度成为国内继腾讯、阿里、字节跳动之后,又一家积极参与开源的科技巨头,表明其在大模型应用时代的决心。

元宇宙 科幻 赛博朋克 绘画 (5)大模型

图源备注:图片由AI生成,图片授权服务商Midjourney

早在今年2月,百度就已透露文心大模型4.5系列的推出计划,并预告于6月30日开源。尽管此次开源列表中未包含其升级版文心大模型4.5Turbo,但仍引发了开发者的热议。许多开发者认为,小参数版本模型非常适合内存受限的配置,且在性能上也表现不俗,有望与其他大型模型如 DeepSeek V3和阿里 Qwen 进行竞争。

文心大模型4.5系列是一款原生多模态基础大模型,百度在多个测试中显示其表现超越了竞争对手 GPT-4o。该模型不仅能理解文本,还能处理照片、视频等多种视觉信息,展示了其在多模态理解与生成方面的强大能力。

百度在开源文心大模型4.5系列的背后,主要依靠三大技术创新:首先是多模态异构 MoE 预训练,使模型能够有效捕捉文本和视觉模态的信息;其次是高效的基础设施,以实现快速训练和推理;最后是针对特定模态的后训练,使得模型在多样化的实际应用中表现更佳。

随着全球大模型市场竞争的加剧,百度的开源举措无疑对其他闭源模型供应商形成了压力,提升了整个行业的技术标准。这一行动也为广大开发者和研究人员提供了更多自由度,有助于他们更快速地进行模型迭代与应用,推动人工智能的进步。

点赞(0)
顶部