阿里通义千问 Qwen3 系列模型有望今日发布，支持 256K 上下文长度

AI技术专栏作家 | 发布了 246 篇文章

感谢IT之家网友兰花是我、四文鱼的线索投递！

IT之家 4 月 28 日消息，阿里通义千问开源负责人林俊旸在 X 上发文暗示，Qwen3 模型有望今日发布。

值得一提的是，Qwen3 系列模型合集已在阿里巴巴旗下 AI 模型开源社区 ModelScope（魔搭）短暂亮相后又下线，包括 Qwen3-4B-Base、Qwen3-1.7B、Qwen3-0.6B 及 Qwen3-30B-A3B-Base 四款模型。所有模型均采用 Apache License 2.0 开源协议。尽管官方尚未发布正式公告，但结合命名规则与前代技术逻辑，可推测其技术路径与定位方向。

此次发布的模型中，Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B 以参数规模直接命名，分别对应 40 亿、17 亿和 6 亿参数。此类无后缀的命名方式或表明其为单架构稠密模型，未采用混合专家（MoE）设计，推测主打轻量化应用场景。而 Qwen3-30B-A3B-Base 为 MoE 架构基础模型，总参数 300 亿（30B）中动态调用 30 亿（3B）参数处理任务。