逻辑推理 - AI学习站

2025年高考数学新一卷上热搜：6个AI大模型宣布挑战谁更强？

AI热点 10月前

2025年高考数学新一卷上热搜：6个AI大模型宣布挑战谁更强？

近日，随着高考的落幕，一场别样的“高考”也在各大AI大模型之间展开。此次测试邀请了多家知名科技公司的大模型，参与2025年数学新课标Ⅰ卷中的14道客观题测试，以此检验它们在逻辑推理和数学能力上的表现。测试题目包括8道单选题、3道多选题和3道填空题，满分73分，测试过程严格遵循高考判分原则。测试结果显示，字节跳动的豆包和腾讯的元宝（T1）以68分的总成绩并列第一，仅在第6道单选题上失分。深度求索

AI中国

AI中国

168 0

生成很强，推理很弱：GPT-4o的视觉短板

AI热点 1年前

生成很强，推理很弱：GPT-4o的视觉短板

声明：本文来自微信公众号“大数据文摘”（ID:BigDataDigest），作者:文摘菌，授权站长之家转载发布。如果让AI画一只狗站在“左边”，但事先告诉它“左就是右”，你觉得它能反应过来吗?最近，UCLA的一项新研究用一系列精心设计的实验，揭开了GPT-4o在图像理解和推理上的短板——它画得漂亮，却未必真懂你的意思。论文主线很直接，GPT-4o的画图能力确实惊艳，但真正涉及理解图像、语境推理

AI中国

AI中国

259 0

6个AI大模型大战2025年高考数学新一卷：数学题推理能力均显著提升

AI热点 10月前

6个AI大模型大战2025年高考数学新一卷：数学题推理能力均显著提升

近日，随着高考的圆满结束，一场别开生面的“数学擂台赛”在各大AI大模型间悄然展开。多家知名科技公司的大模型被邀请参与2025年数学新课标Ⅰ卷中的14道客观题测试，以此检验它们在逻辑推理和数学能力上的实力。此次测试题目包含8道单选题、3道多选题以及3道填空题，满分设定为73分，且测试过程严格遵循高考判分原则，确保结果的公正性与准确性。测试成绩揭晓后，字节跳动的豆包和腾讯的元宝（T1）以68分的总

AI中国

AI中国

291 0

热门标签

发现《PROJECT: Yi (Vicetone Remix)》 AI概览情感叙事模型音乐综合禁止大规模监控 Grok3Mini MCP服务导航技术 Qwen-VL 视频

热门作者

作者头像

AI科技前沿

102篇文章

作者头像

机器学习笔记

87篇文章

作者头像

AI绘画大师

64篇文章

热门阅读

1

6种AI声音克隆工具，听说还有99%的人不知道（建议收藏）

1992 阅读

2

蛋仔派对：看别人让豆包看图片猜人物，我便让他认一下蛋仔皮肤！

1952 阅读

3

WMS 系统「入库管理」功能详解

1669 阅读

4

速抢（2核2G）77元/年香港免备案服务器

1556 阅读

5

协作机器人HMI优化指南：从示教器到控制软件的可用性与性能升级

1372 阅读

6

YouMind: 你的AI创作新范式

1340 阅读

7

0代码经验，半天时间，我用Cursor从0到1开发了微信小程序并上线，附教程+提示词

1307 阅读

8

AI制作ASMR视频也能火爆全网，沉浸式切水果视频教程

1260 阅读

9

教运营使用DeepSeeK+ECharts画桑吉图

1224 阅读

10

可口可乐，你浓眉大眼的也用AI做广告了？

1120 阅读

11

分享4个超简单的DeepSeek提示词公式，让你的DeepSeek秒懂你

1093 阅读

12

即梦AI图片3.0智能参考图指南，也能一句话做出爆款设计了

1042 阅读

13

怎样才能制作出一个数字人？一分钟教你完成AI数字人制作

980 阅读

14

别再花钱去拍形象照了，教你一键制作大师级人物摄影照

941 阅读

15

扣子节点文本转Word攻略：4步搞定，告别手动排版！

921 阅读

16

全新SkyReels正式上线

912 阅读

17

拼多多直通车优化技巧

873 阅读

18

我用一张表格，把带娃从“鸡飞狗跳”变成“母慈子孝”！

872 阅读

19

靠AI做美食图？小白也能轻松制作出让人垂涎欲滴的美食照片

864 阅读

20

我用腾讯3D Studio让原神的芙宁娜活了，能跑还能打

829 阅读