o3-mini物理推理粉碎DeepSeek R1,OpenAI王者归来!全网最全实测来袭

在科技界,一天的时间足以改写历史。DeepSeek R1用「降维打击」重构了AI界,OpenAI不甘示弱放出了o3-mini,再次加冕为王。o3-mini的进步可不是一点半点,在数学代码等基准测试中,均拿下了最高的成绩。甚至,在「物理模拟」高难度挑战战场上,o3-mini直接粉碎R1,展现出惊人的实力。能够清晰地看出,o3-mini具备更强的物理推理能力,DeepSeek表现出明显的「反重力」现

我让男同事去测测豆包大模型1.5,结果他被豆包钓成翘嘴了

真的是离谱。众所周知,每当业内有牛逼的大模型发布,肯定免不了被咱们号一顿 case 毒打,让这个模型知道什么叫人类的智慧,让它低调做人。但这次,终于翻车了。事情是这样的。昨天豆包大模型 1.5 全家桶正式发布了嘛,官方刚发布 15 分钟,就被咱们 Family 群里的家人给发现了,并且发出灵魂拷问——谁能测测?行,测测就测测。我就让编辑部的一个男同事去测了。而且我告诉同事,有家人说豆包大模型是非

实测Claude 3.7:3200行代码一口气输出,物理规律手拿把掐,弱智吧已失守

Claude 3.7新鲜出炉全网热议,到底有多强?第一波实测来了!简单粗暴总结,它在编程、现实世界任务上,能力爆表。只需一个样本,就能一下子吐出3200多行代码,做出一个可玩性很高的游戏。像什么跳跃、打怪、回血、吃金币……一系列复杂的游戏机制都完美呈现了出来。有意思的是,这个游戏还和Meta Quest里的VR游戏《霓虹奥德赛(Neon Odyssey)》同名。物理规律也能准确把握,有人仅用3个

小红书偷偷上线了一个巨巨巨巨好用的AI神器,我帮你们试了一下……

大家好,这里是秋叶编辑部,我是子珊~就在前两天,小红书悄咪咪地上线了一款名为「点点」的 AI 搜索产品。作为一名遇事不决,就小红书一下的小红书重度使用者,我立刻就去体验了一把!其实,这并不是小红书第一次在 AI 领域进行尝试,在 2023 年,小红书就曾推出过一款名为「达芬奇」的 AI 聊天助手👇但上线后被不少网友吐槽适用场景有限,对语言的理解能力也相对较差,容易出现「答非所问」的情况.....

三大顶流AI 3D模型真实评测 - 腾讯新开源的混元3D 2.0、Tripo3D和Meshy

就在刚刚,腾讯混元3D全新版本上线了。距离我拿到内测资格已经过去了小一周,这一周内我在混元3D、Tripo3D、Meshy这三家AI 3D里跑了上百次案例,在文生3D、图生3D、纹理材质生成、3D工作流四个维度,让小白也能最大程度体验到AI 3D能做到什么,以及将如何影响AI生图、AI视频的工作流。这可能是中文区第一篇系统性横向对比AI 3D的文章。很高兴能跟大家分享。腾讯混元3D 🔗:http

全网首发!实测全球首个 AI 程序员 Devin,月薪3500的全能实习生?

省流版:Devin 是一种全新的 AI 编程,他和 Cursor 还有 Windsurf 的区别在于,Devin 不需要你来操作,你只需要告诉他要做什么。你是 CTO/开发组长! 大家还记得今年三月横空出世的 AI 项目 Devin 吗?它当时可是火遍全网,原因就是它自诩为“全球首个 AI 软件工程师”。这下可炸开了锅,大家纷纷好奇:AI 程序员到底有多厉害?会不会也像人类一样“摸鱼”?程序员们

AI大模型权威评测:豆包中文对话最强,OpenAI o1推理和数学占优

国产AI模型多点开花。还有不到一周就2025年了,各大社交音娱平台相继自动弹出“年度报告”的搜索选项。身处AI元年,AI模型这份年终答卷,自然也少不了。 智东西12月25日报道,智源研究院12月19日发布了FlagEval“百模”评测结果,今年国产大模型与海外大模型战况焦灼。 在其闭源大模型评测能力总榜中,字节跳动的豆包通用模型pro拿到主观评测最高分,OpenAI的o1-mini拿到客观评测最

J1 Assistant 新鲜上手体验,熟悉的罗永浩,熟悉的 AI 锤科味儿?

1月5日,罗永浩旗下的 AI 初创项目悄悄在海外上线,我们也在第一时间上手体验了这款产品,为大家带来最“热乎”的产品体验。J1 Assistant 图源:不客观实验室官网:https://matter.ai/  需要科学上网方可访问,目前的 Beta 版仅支持 Android 手机下载。需要注意的是,目前软件在点开后需要登陆并绑定手机,但国内手机号码无法正常获得验证码,想要正常使用这款软件,你需

Kimi 首个多模态功能体验,AI 一键为音乐生成 MV,月之暗面不再只卷长文本

在闭着眼睛听一首歌的时候,你有没有在脑海里想象过,应该搭配什么画面?Kimi 内测的最新功能「创作音乐视频」,就是奔着当 MV 导演去的。长文本领先的 Kimi,默不作声地「跨界」了。APPSO 也受邀首批体验了这一新功能。给 Kimi 一首歌,然后等待几首歌的时间,它就还你一个短视频,能踩点,懂分镜,审美也不错。当 MV 导演,Kimi 真的有点懂行懂王入场曲、川普战歌《YMCA》,谁上头了?