开源项目 8月前 • 129 阅读 • 0 评论

Meta开源首个代码世界模型！CWM：让AI像程序员一样思考与创造！

作者头像

AI中国

AI技术专栏作家 | 发布了 246 篇文章

近日，Meta公司开源了其创新性的代码世界模型（Code World Model，简称CWM），这一突破性技术正在AI编程领域引发广泛关注。

Yann LeCun 也亲自下场转发撑场子了。

与传统的代码生成模型不同，CWM采用了一种全新的世界建模方法，让AI能够像人类程序员一样进行代码推理和模拟执行。

CWM是一个拥有320亿参数的开放权重大语言模型，采用稠密的仅解码器结构，支持最长131k tokens的上下文长度。在性能方面，该模型展现出令人印象深刻的能力：

SWE-bench Verified：pass@1达到65.8%

LiveCodeBench：68.6%的准确率

Math-500：96.6%的高分表现

AIME 2024：76.0%的优秀成绩

主要功能

代码生成：模型能生成高质量的代码片段，适用多种编程任务，如解决编程竞赛问题、修复代码错误、实现新功能等。

代码理解：模型通过模拟代码执行过程，理解代码的逻辑和行为。

数学和逻辑推理：在生成代码的同时，进行数学和逻辑推理，适用复杂的编程任务和问题解决。

多语言支持：目前主要支持Python，架构和方法能扩展到其他编程语言。

强化学习支持：通过与环境的交互（如执行代码、观察结果），CWM能不断优化生成的代码，提高准确性和效率。

性能表现

CWM 在有无测试时扩展（tts）的情况下均达到了同类最佳性能，分别取得了65.8%和53.9%的成绩。

CWM在Aider Polyglot官方排行榜上的表现：

在 Aider Polyglot 基准上，采用整文件编辑格式（whole file edit format）时，CWM 在不同编程语言上的准确率表现。

在Terminal-Bench和BigOBench等复杂任务测试中，CWM同样表现出色：

CWM代码世界模型的出现标志着AI编程向真正理解和推理代码语义的方向迈出了重要一步，同时为构建更加智能、可靠的编程助手奠定了坚实基础。

开源地址
:https://github.com/facebookresearch/cwm

#github##AI开源项目推荐##AI技术##Meta#AI代码世界模型

作者头像

AI前线

专注人工智能前沿技术报道，深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了！视频分析功能将极大扩展AI的应用场景，特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度？我们正在开发一个实时视频分析应用，非常关注性能表现。

作者头像

AI前线作者

12小时前

我们测试的平均响应时间在300ms左右，比上一代快了很多，适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平，这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用！

文章章节

1. GPT-4简介与注册指南

1.1 账号注册步骤

推荐文章

北京人形开源最新VLM模型，推动具身智能再迈关键一步 !

北京人形开源最新VLM模型，推动具身智能再迈关键一步 !

6月前 • 开源项目

超大参数量具身VLM开源：首创DPPO训练范式，模型性价比天花板

超大参数量具身VLM开源：首创DPPO训练范式，模型性价比天花板

6月前 • 开源项目

用了Rust，谷歌实测：Android上内存漏洞率比C/C++低1000倍！

用了Rust，谷歌实测：Android上内存漏洞率比C/C++低1000倍！

6月前 • 开源项目

全球最大开源具身大模型！中国机器人跑完马拉松后开始学思考

全球最大开源具身大模型！中国机器人跑完马拉松后开始学思考

6月前 • 开源项目

刚刚，华为AI推理大招开源，时延降90%，吞吐提22倍，上下文10倍级扩展

刚刚，华为AI推理大招开源，时延降90%，吞吐提22倍，上下文10倍级扩展

7月前 • 开源项目

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • 开源项目

开源即爆火！英伟达重磅推出OmniVinci全模态大模型

开源即爆火！英伟达重磅推出OmniVinci全模态大模型

7月前 • 开源项目

国际刑事法院也“踢掉”了微软Office！因邮箱一度“被封”，决定改为开源替代品openDesk

国际刑事法院也“踢掉”了微软Office！因邮箱一度“被封”，决定改为开源替代品openDesk

7月前 • 开源项目

热门标签

教育变革 DingTalkA1 IP66级 AI变现项目极速模型 AI闺蜜机 GoogleWorkspaceforEducation AI生成假书 cursor小程序 AI绘画

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝