AI热点 2月前 • 169 阅读 • 0 评论

业界首个：腾讯混元-A13B 模型发布并开源，极端条件 1 张中低端 GPU 卡即可部署

作者头像

AI技术专栏作家 | 发布了 246 篇文章

HuggingFace

HuggingFace

0秒前

感谢IT之家网友 Autumn_Dream 的线索投递！

IT之家 6 月 27 日消息，腾讯混元大模型家族今日宣布迎来新成员 —— 混元-A13B 模型发布并开源，号称是“业界首个 13B 级别的 MoE 开源混合推理模型”。

混元-A13B 作为基于专家混合（MoE）架构的大模型，总参数 800 亿、激活参数 130 亿，号称“在效果比肩顶尖开源模型的同时，大幅降低推理延迟与计算开销”。

腾讯混元表示，这对个人开发者和中小企业来说，无疑是个好消息，极端条件下仅需 1 张中低端 GPU 卡即可部署。用户可以在 Github、HuggingFace 等技术社区下载使用，模型 API 已在腾讯云官网上线。

混元-A13B 模型通过 MoE 架构，为每个输入选择性地激活相关模型组件，号称与同等规模的密集模型相比“又快又省”，而且为个人开发者和中小企业提供了一个“可扩展且高效的替代方案”。

预训练中，模型用了 20 万亿高质量网络词元语料库，提升了模型推理能力的上限；完善了 MoE 架构的 Scaling Law （即规模定律）理论体系，为 MoE 架构设计提供了可量化的工程化指导，提升了模型预训练效果。

用户可以按需选择思考模式，快思考模式提供简洁、高效的输出，适合追求速度和最小计算开销的简单任务；慢思考模式涉及更深、更全面的推理步骤。这优化了计算资源分配，兼顾效率和准确性。

混元还开源了两个新数据集，以填补行业内相关评估标准的空白。其中，ArtifactsBench 主要用于代码评估，构建了一个包含 1825 个任务的新基准；C3-Bench 针对 Agent 场景模型评估，设计了 1024 条测试数据，以发现模型能力的不足。

从具体效果来看，数学推理方面，例如输入“9.11 和 9.9 谁大”，模型可准确完成小数比较，并展现分步解析能力。

对于时下热门的智能体（Agent）应用，模型可调用工具，生成出行攻略、数据文件分析等复杂指令响应。

再看数据和效果。在多个公开数据测试集上，模型在数学、科学和逻辑推理任务上表现出“领先效果”。

IT之家附开源地址：

https://github.com/Tencent-Hunyuan/Hunyuan-A13B

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道，深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了！视频分析功能将极大扩展AI的应用场景，特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度？我们正在开发一个实时视频分析应用，非常关注性能表现。

作者头像

AI前线作者

12小时前

我们测试的平均响应时间在300ms左右，比上一代快了很多，适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平，这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用！

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

靠10万+粉丝，北漂插画师秒贷款！华为全栈AI加速，让银行及时看见

靠10万+粉丝，北漂插画师秒贷款！华为全栈AI加速，让银行及时看见

26分钟前 • AI热点

拼多多的‘本分’哲学：为何不碰网贷与AI？

拼多多的‘本分’哲学：为何不碰网贷与AI？

5小时前 • AI热点

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • AI热点

一个暴论：普通人最大的AI杠杆，可能是多生孩子

一个暴论：普通人最大的AI杠杆，可能是多生孩子

5小时前 • AI热点

马斯克新模型：9折价格实现Gemini 2.5性能，支持2M上下文

马斯克新模型：9折价格实现Gemini 2.5性能，支持2M上下文

7小时前 • AI热点

靠10万+粉丝，北漂插画师秒贷款！华为全栈AI加速让银行及时看见

靠10万+粉丝，北漂插画师秒贷款！华为全栈AI加速让银行及时看见

2小时前 • AI热点

一个平台用遍主流生图视频模型，Seko这波功能更新太香了

一个平台用遍主流生图视频模型，Seko这波功能更新太香了

6小时前 • AI热点

鸿蒙的全面进击：“天工计划”十亿重磅加码，打造AI全场景新生态

鸿蒙的全面进击：“天工计划”十亿重磅加码，打造AI全场景新生态

5小时前 • AI热点

热门标签

AI实施腾讯音乐应届生就业 friday night funkin' TripletTransformer 漫画视频大模型算法 Paradigm 大模型本地部署 #comfyui教程

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝