开源的风吹到视频生成:阿里开源登顶VBench的万相大模型,一手实测来了!

千问Qwen+万相Wan,阿里已实现全模态开源。当很多 AI 公司还就是否该走开源路线而感到左右为难时,阿里的技术团队又开源了一个新的模型 —— 万相(Wan)视频生成大模型(包括全部推理代码和权重,最宽松的开源协议)。经常玩视频生成模型的同学应该知道,当前的很多模型仍然面临多方面挑战,比如难以还原复杂的人物动作,处理不好物体交互时的物理变化,遇到长文本指令就「选择性遵循」等。如果三个方面都做得

一手体验首款通用Agent产品Manus - 唯有惊叹。

昨天夜里,深夜惊雷。一个新团队突然发了一个首款通用行的项目:Manus。演示在此,我人直接看麻了。看完我的第一感觉,卧槽,人类又要一败涂地了。这尼玛,就是OpenAI的DeepResearch和Claude的Computer Use的究极集合体,甚至,他还能自己写代码,直接Coding Agent。这特么是什么怪物啊。。。我预想到这一天会来,只是没想到,来的如此之早。Manus在GAIA的评分上

我让男同事去测测豆包大模型1.5,结果他被豆包钓成翘嘴了

真的是离谱。众所周知,每当业内有牛逼的大模型发布,肯定免不了被咱们号一顿 case 毒打,让这个模型知道什么叫人类的智慧,让它低调做人。但这次,终于翻车了。事情是这样的。昨天豆包大模型 1.5 全家桶正式发布了嘛,官方刚发布 15 分钟,就被咱们 Family 群里的家人给发现了,并且发出灵魂拷问——谁能测测?行,测测就测测。我就让编辑部的一个男同事去测了。而且我告诉同事,有家人说豆包大模型是非

实测Claude 3.7:3200行代码一口气输出,物理规律手拿把掐,弱智吧已失守

Claude 3.7新鲜出炉全网热议,到底有多强?第一波实测来了!简单粗暴总结,它在编程、现实世界任务上,能力爆表。只需一个样本,就能一下子吐出3200多行代码,做出一个可玩性很高的游戏。像什么跳跃、打怪、回血、吃金币……一系列复杂的游戏机制都完美呈现了出来。有意思的是,这个游戏还和Meta Quest里的VR游戏《霓虹奥德赛(Neon Odyssey)》同名。物理规律也能准确把握,有人仅用3个

三大顶流AI 3D模型真实评测 - 腾讯新开源的混元3D 2.0、Tripo3D和Meshy

就在刚刚,腾讯混元3D全新版本上线了。距离我拿到内测资格已经过去了小一周,这一周内我在混元3D、Tripo3D、Meshy这三家AI 3D里跑了上百次案例,在文生3D、图生3D、纹理材质生成、3D工作流四个维度,让小白也能最大程度体验到AI 3D能做到什么,以及将如何影响AI生图、AI视频的工作流。这可能是中文区第一篇系统性横向对比AI 3D的文章。很高兴能跟大家分享。腾讯混元3D 🔗:http

小红书偷偷上线了一个巨巨巨巨好用的AI神器,我帮你们试了一下……

大家好,这里是秋叶编辑部,我是子珊~就在前两天,小红书悄咪咪地上线了一款名为「点点」的 AI 搜索产品。作为一名遇事不决,就小红书一下的小红书重度使用者,我立刻就去体验了一把!其实,这并不是小红书第一次在 AI 领域进行尝试,在 2023 年,小红书就曾推出过一款名为「达芬奇」的 AI 聊天助手👇但上线后被不少网友吐槽适用场景有限,对语言的理解能力也相对较差,容易出现「答非所问」的情况.....

全网首发!实测全球首个 AI 程序员 Devin,月薪3500的全能实习生?

省流版:Devin 是一种全新的 AI 编程,他和 Cursor 还有 Windsurf 的区别在于,Devin 不需要你来操作,你只需要告诉他要做什么。你是 CTO/开发组长! 大家还记得今年三月横空出世的 AI 项目 Devin 吗?它当时可是火遍全网,原因就是它自诩为“全球首个 AI 软件工程师”。这下可炸开了锅,大家纷纷好奇:AI 程序员到底有多厉害?会不会也像人类一样“摸鱼”?程序员们

J1 Assistant 新鲜上手体验,熟悉的罗永浩,熟悉的 AI 锤科味儿?

1月5日,罗永浩旗下的 AI 初创项目悄悄在海外上线,我们也在第一时间上手体验了这款产品,为大家带来最“热乎”的产品体验。J1 Assistant 图源:不客观实验室官网:https://matter.ai/  需要科学上网方可访问,目前的 Beta 版仅支持 Android 手机下载。需要注意的是,目前软件在点开后需要登陆并绑定手机,但国内手机号码无法正常获得验证码,想要正常使用这款软件,你需

AI大模型权威评测:豆包中文对话最强,OpenAI o1推理和数学占优

国产AI模型多点开花。还有不到一周就2025年了,各大社交音娱平台相继自动弹出“年度报告”的搜索选项。身处AI元年,AI模型这份年终答卷,自然也少不了。 智东西12月25日报道,智源研究院12月19日发布了FlagEval“百模”评测结果,今年国产大模型与海外大模型战况焦灼。 在其闭源大模型评测能力总榜中,字节跳动的豆包通用模型pro拿到主观评测最高分,OpenAI的o1-mini拿到客观评测最