AI热点 9月前 147 阅读 0 评论

智谱 GLM-4.5 系列 AI 模型踪迹曝光,预估采用新混合专家架构

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

感谢IT之家网友 GreatMOLA 的线索投递!

IT之家 7 月 25 日消息,根据 modelscope / ms-swift 代码库显示的 commit 记录,智谱即将发布 GLM-4.5 系列模型,预估采用全新的混合专家(MoE)结构,是一款多模态可扩展大模型。

根据 commit 上显示的代码,GLM-4.5 系列模型预估会有 GLM-4.5(355B-A32B)和 GLM-4.5-Air(106B-A12B)两款模型。

IT之家附上网友 @惊鱼 在 Linux DO 论坛发布的分析内容如下:

GLM-4.5 是基于混合专家(MoE)结构的多模态可扩展大模型,具备高吞吐推理、结构化工具调用、可解释推理追踪、分布式负载均衡等特性。

支持多专家分组、负载均衡、分布式推理和多 token 预测(MTP)推理。

添加了新的推理解析器和工具调用解析器,允许模型输出严格的… 推理内容和 工具调用内容,便于工具增强推理与函数调用。

文档显示 GLM-4.5 支持 T(文本)、I(图像)、E+(可扩展)、V+(视觉扩展),表明模型定位为多模态增强大模型。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!