LMArena - AI学习站

Meta 新模型 Llama-4-Maverick 排名骤降，引发刷榜质疑

AI热点 1年前

Meta 新模型 Llama-4-Maverick 排名骤降，引发刷榜质疑

近日，Meta 公司发布的开源大模型 Llama-4-Maverick 在 LMArena 的排行榜上从第二名直降至第32名，这一剧烈波动引发了开发者们的广泛质疑，认为 Meta 可能通过提交特供版本以刷榜。事情的起因要追溯到4月6日，Meta 发布了其最新的大模型 Llama4，包括 Scout、Maverick 和 Behemoth 三个版本。其中，Llama-4-Maverick 在初期的评

AI中国

AI中国

222 0

AI热点 1年前

Perplexity 竞技场夺冠，Sonar挑战谷歌Gemini的搜索霸主地位

在最新的 LM Arena Search Arena 评估中，Perplexity 公司的 Sonar-Reasoning-Pro-High 模型表现优异，与谷歌的 Gem-2.5-Pro-Grounding 模型并列第一，直接对决的胜率达到53%。这一消息无疑给搜索引擎领域带来了新的震动，显示了 Perplexity 在 AI 搜索技术上的强大实力。Sonar 系列模型在此次评估中包揽了前四名，

AI中国

AI中国

310 0

LMArena正式成立公司，致力于提供中立的AI评估平台

AI热点 12月前

LMArena正式成立公司，致力于提供中立的AI评估平台

近日，备受关注的人工智能评估平台 LMArena 宣布将成立一家新公司，名为 Arena Intelligence Inc.，以便为未来的项目改进提供更强大的资源。LMArena 的创始团队在博客中表示，新公司的成立将帮助他们在保持中立的同时，增强大型语言模型（LLM）测试平台的功能，致力于为 AI 用户提供一个不受任何企业影响的公平评估环境。LMArena 于2023年由加州大学伯克利分校的研究

AI中国

AI中国

351 0

Meta被指AI模型

AI热点 1年前

Meta被指AI模型"双标":评测版与公开版Maverick表现大相径庭

Meta周六发布了其新旗舰AI模型Maverick，该模型在LM Arena评测中排名第二。LM Arena是一项依靠人类评分者比较不同模型输出并选择偏好的测试平台。然而，多位AI研究人员很快发现，Meta部署到LM Arena的Maverick版本似乎与开发人员广泛使用的版本存在显著差异。Meta在公告中承认，LM Arena上的Maverick是一个"实验性聊天版本"。与此同时，Llama官方

AI中国

AI中国

282 0

热门标签

AI时代类人形机器人技术较量语音识别技术 LUI 与 GUI 选择未出版作品长虹电视发现《Superman》产品开发 AI搜索优化

热门作者

作者头像

AI科技前沿

102篇文章

作者头像

机器学习笔记

87篇文章

作者头像

AI绘画大师

64篇文章

热门阅读

1

6种AI声音克隆工具，听说还有99%的人不知道（建议收藏）

902 阅读

2

AI制作ASMR视频也能火爆全网，沉浸式切水果视频教程

747 阅读

3

【SD绘画教程】5月最新StableDiffusion保姆级全套教程+SD必备插件模型——秋叶SD零基础入门到精通 AI绘画出图全流程教学实战（附SD安装包）

722 阅读

4

AI副业带货轻松变现，0基础3分钟搞定图文全流程！

689 阅读

5

蛋仔派对：看别人让豆包看图片猜人物，我便让他认一下蛋仔皮肤！

686 阅读

6

【全108集】2025 最新发布！即梦AI3.0独家保姆级教程来啦！AI绘画+图生视频+脚本+剪辑完整流程详解！设计师必学的首款AI软件，按头就能学会

675 阅读

7

教运营使用DeepSeeK+ECharts画桑吉图

661 阅读

8

速抢（2核2G）77元/年香港免备案服务器

642 阅读

9

【AI绘画】StableDiffusion插件之NSFW审查（瑟瑟审查）安装使用教程

597 阅读

10

分享4个超简单的DeepSeek提示词公式，让你的DeepSeek秒懂你

535 阅读

11

360 AI 浏览器来了！免费用 AI 还能剪视频？

509 阅读

12

MegaTTS3 V3版 - 去除上传npy限制真开源! 字节高保真语音克隆、文本转语音软件支持50系显卡本地一键整合包下载

508 阅读

13

Deepseek做表情包！首月变现！电脑操作有手就会~

496 阅读

14

即梦AI图片3.0智能参考图指南，也能一句话做出爆款设计了

494 阅读

15

如何免费使用VEO3？绝对不能错过的攻略

480 阅读

16

【AI绘画教程】专为电商设计师打造的StableDiffusion入门教程，从0到1掌握AI绘图+商业落地系列SD教程！基础入门+实战案例，一周掌握SD

470 阅读

17

认识Sora 理解Sora

466 阅读

18

怎样才能制作出一个数字人？一分钟教你完成AI数字人制作

436 阅读

19

WMS 系统「入库管理」功能详解

422 阅读

20

突破性更新！Vidu1.5让AI视频保持角色一致性从未如此简单～

413 阅读