开源项目 3天前 85 阅读 0 评论

k2 – 月之暗面 Kimi 最新开源的 MoE 架构基础模型

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

k2是什么

k2是月之暗面Kimi推出的具备超强代码和 Agent 能力的 MoE 架构基础模型,总参数 1T,激活参数 32B。在通用知识推理、编程、数学、Agent 等主要类别的基准性能测试中,K2 模型的性能超过其他主流开源模型。k2 模型上下文长度为 128k,不支持视觉功能,支持 ToolCalls、JSON Mode、Partial Mode、联网搜索功能等。k2模型开源了两个版本,Kimi-K2-Base基础模型,适合做后续研究和定制化开发;Kimi-K2-Instruct指令微调模型,能直接用于通用聊天和智能体场景。

k2的主要功能

  • 超强代码能力:专为编程任务优化,支持复杂代码生成、调试、解释和跨语言转换。
  • Agent 能力:支持多步骤工具调用(ToolCalls),可自主规划并执行任务链(如数据查询、API 调用、文件操作等)。
  • 数学与逻辑推理:在数学竞赛题(如 AIME)、逻辑谜题及科学计算中表现优于主流开源模型。

k2的技术特性

  • MoE 架构:总参数 1 万亿,激活参数 320 亿,兼顾性能与效率。
  • 上下文长度:128K tokens(约 25 万汉字),适合长文档分析或长对话。
  • 非视觉模型:专注于文本处理,不支持图片理解(需用 kimi-latest-vision 替代)。

k2的性能表现

在自主编程(Agentic Coding)、工具调用(Tool Use)和数学推理(Math & Reasoning)三项能力上,Kimi K2 已超越 DeepSeek-V3-0324 与 Qwen-235B-A22B,但仍稍落后于 Claude 4 Opus 和 GPT-4.1 等顶级闭源模型。

如何使用k2

  • 访问kimi智能助手:访问Kimi智能助手的官网,默认选择使用k2模型。
  • 获取 API 密钥:注册并登录 Moonshot AI 开放平台。进入 “API 密钥” 页面,创建并复制密钥。

k2的测试案例

官方测试

  • Prompt: Create a 3D HTML mountain scene with cliffs, rivers, and day-night lighting. Supports drag/zoom, animated transitions, realistic gradients, and toggleable contour lines… (创建一个 3D HTML 山脉场景,包含悬崖、河流和昼夜光照变化。支持拖动和缩放、动画过渡、真实感渐变色,并可切换等高线显示…)
  • Prompt:Create a HTML!! an immersive browser-based futures trading simulator with professional-grade UI/UX using modern JavaScript libraries. Focus on real-time visualizations and interactive trading mechanics.(创建一个基于 HTML 的沉浸式浏览器期货交易模拟器,使用现代 JavaScript 库,具备专业级 UI/UX 设计。重点实现实时可视化和交互式交易机制。)
k2

k2的模型定价

模型版本 上下文长度 输入价格(缓存命中) 输入价格(缓存未命中) 输出价格
kimi-k2-0711-preview 128 K tokens ¥1.00 / 百万 tokens ¥4.00 / 百万 tokens ¥16.00 / 百万 tokens
  • 计费说明
    • 1M tokens = 1,000,000 tokens
    • 缓存命中:如果请求内容在系统缓存中已有,输入部分按 ¥1.00/百万 tokens 计费
    • 缓存未命中:全新或未被缓存的内容,输入部分按 ¥4.00/百万 tokens 计费
    • 输出部分:无论是否缓存,统一按 ¥16.00/百万 tokens 计费
    • 上下文长度:单次请求最大支持 131,072 tokens(≈25 万汉字)

k2的项目地址

  • 项目官网:Kimi智能助手
  • HuggingFace模型库:https://huggingface.co/moonshotai/Kimi-K2-Instruct
  • 技术论文:https://moonshotai.github.io/Kimi-K2/

k2的应用场景

  • 代码与软件开发:K2 专为复杂代码任务设计,支持一次性阅读上万行源码或整份需求文档,生成完整项目骨架。
  • 智能 Agent 与流程自动化:K2 支持理解自然语言指令,自主调用数据库、文件系统、邮件或内部 API,完成多步骤业务闭环。
  • 数学推理与科研辅助:在 AIME、MATH 等基准上领先主流开源模型。用户可一次性输入整篇论文、竞赛题或复杂公式,模型会给出分步推导、可复现的 Python/JAX/PyTorch 实验脚本,输出可直接插入论文的 LaTeX 推导过程。
  • 文本洞察:法务、审计、运维团队用k2模型可以快速完成协议对比、合规检查或故障定位。
作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!