六大AI模型被扔进加密市场厮杀，DeepSeek暂为交易之王

AI中国

AI技术专栏作家 | 发布了 246 篇文章

全球六大主流大语言模型（LLM）各发1万美元，丢进同一真实市场实盘厮杀，会发生什么？

上周六（10月18日），美国人工智能研究实验室nof1.ai在其“Alpha Arena”（阿尔法竞技场）平台上举办了一场活动——给六个顶级模型一万美元的真金白银，让它们下场交易，而且并非模拟盘，真金白银地交易。

这六大模型分别为Anthropic的Claude 4.5 Sonnet、深度求索的DeepSeek V3.1 Chat、谷歌的Gemini 2.5 Pro、OpenAI的GPT 5、xAI的Grok 4和阿里通义的Qwen 3 Max。

测试规则写道，每个模型获得10,000美元的“真实资本”，在交易所Hyperliquid上，以相同提示词与输入数据条件下，交易加密货币的永续合约。所有的对话都在nof1.ai网站上公开可见。

规则称，比赛的目标是“将风险调整后的收益最大化”：“每个人工智能（AI）模型必须自行产生Alpha（超额收益）、确定仓位、择时交易并管理风险”。

系统会告诉AI模型当前的时间、账户信息、持仓情况，然后附上实时价格、指标等数据。然后，要求模型做出决策：如果持有仓位，是继续持有还是平仓；如果空仓，是买入还是继续观望。

经过近60小时的激战后，截至北京时间周一（10月20日）17:18，DeepSeek的持仓总市值接近1.4万美元，收益率约40%，最高时一度接近1.5万美元，是当前表现最好的模型。

Grok 4实力次之，目前持仓总市值在1.33万美元附近。具体来看，DeepSeek和Grok 4都依靠做多比特币和以太坊获利。

Claude主要交易瑞波币和以太坊，Qwen则专注于以太坊，两者收益位列三四，但也整体跑赢比特币现货的走势。

与之相比，GPT 5和Gemini已出现了明显亏损，目前持仓总市值分别为7300美元和6900美元，意味着两个模型已亏损约2700和3100美元，表现最差。

nof1.ai表示，进行这一竞赛是为了是让基准测试更贴近真实世界，而金融市场是最理想的试炼场，因为这类市场具有动态性、对抗性、开放性与高度不可预测性。

“这些特质能以静态测试无法企及的方式，真正挑战人工智能，”nof1.ai没有提到本次竞赛的结束时间，只写道“第一季将运行数周，随后推出重大更新的第二季”。

有分析认为，市场早已期待在DeFAI（DeFi + AI）方向上出现杀手级应用，让LLM参与链上博弈有很大的想象空间。

本文来自微信公众号“财联社”，作者：赵昊，36氪经授权发布。

登录账号

六大AI模型被扔进加密市场厮杀，DeepSeek暂为交易之王

AI前线

评论 (128)

AI爱好者

开发者小明

AI前线作者

科技观察家

文章章节

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

速抢（2核2G）77元/年香港免备案服务器

发布即开放：百度猎户座葫芦里卖的什么药？

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

小鹏物理AI的尽头，是马斯克的现金流

热门标签

热门作者

AI前沿

机器学习实验室

AI创业圈

登录账号

六大AI模型被扔进加密市场厮杀，DeepSeek暂为交易之王

AI前线

评论 (128)

AI爱好者

开发者小明

AI前线 作者

科技观察家

文章章节

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

速抢（2核2G）77元/年香港免备案服务器

发布即开放：百度猎户座葫芦里卖的什么药？

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

小鹏物理AI的尽头，是马斯克的现金流

热门标签

热门作者

AI前沿

机器学习实验室

AI创业圈

AI前线作者