AI热点 6小时前 158 阅读 0 评论

终结Coding?ShellAgent三句话造出马斯克同款「AI女友」

作者头像
新智元

AI技术专栏作家 | 发布了 246 篇文章

Coding或许真的不存在了!

《三体》中科学家杨冬在智子锁死地球科技后绝望的写出了「物理学不存在了」。

不过我们现在不仅不用绝望,还可以非常高兴的喊出「再也不用Coding了」!

从Copilot到Cursor,从Chat到Agent,AI的发展正在吞噬开发的上下游,设计、编码、测试、部署和运维统统不需要。

甚至,就连Vibe Coding 1.0也已经过时,欢迎来到2.0时代!

就在这两天,我们意外发现了一个名为「ShellAgent」的产品,他们主打一个零门槛、端到端的Agent构建,只有想法,没有代码。

三句话就能生成一个「直接使用,直接发布」的APP。

算命/炒股/天气/电影/音乐/视频等统统不在话下,甚至还可以立刻手搓一个马斯克同款「AI女友」。

下面,就让我们一起来见证这些神奇的「魔法时刻」。

一键拥有马斯克同款AI女友

ShellAgent的「工作室(Workshop)」有一种简洁的哲学之美,只有一个对话框。

只需在聊天框输入「帮我制作一个二次元AI女友」,然后就可以转身下楼去买咖啡了。

回来的时候就会发现,ShellAgent不仅准备了一个介绍角色的小卡片,而且还把可以交互的按钮准备好了。

点一下,我们的「AI女友」就做好了。

如果在使用过程中遇到了bug,也完全不用担心。

直接点「Fix with ShellAgent」,就可以一键完成修复了。

不愧是面向「小白」的智能体构建器,实在是贴心。

最后,我们再点击一下右上角的「部署」,就可以和自己定制的「AI女友」互动啦!

比如,我的这位便是一个AI领域的专家。

既然如此,比起闲聊,我们先问问她「什么是强化学习」。

很快,她就开始讲解起了什么是环境、状态、动作、奖励,以及策略等等,而且还用森林里的小动物做了比喻,非常符合人设。

除了直接生成AI女友,我们还可以构建一个「赛博Cosplay」,将真实人物一键P图为动漫风格。

不论是哈利波特风、还是天空之城风,各种风格应有尽有。

而且类似这种生图类的Agent本就是ShellAgent的老本行,一个字,强!

值得一提的是,如果打开「Requirement」,就能看到Agent会自己去写后端功能,不需要手动集成。

比如,在需要生图时,它就会自动生成Flux Widget来实现这个功能。

完全让「小白」跨过所有的前后端、API调用等程序员专属技能。

相比之下,如果我们换成那些传统的AI Coding工具,即便强如Claude Code,也无法做到让idea一键实现。

尤其是,在使用AI Coding工具时,不可避免地要去检查具体的代码;相比之下,ShellAgent真正做到了「无需看任何一行代码」

即使遇到问题,只需要回到Chat界面继续「提需求」即可。

不得不说,ShellAgent这种「一句话打造一个Agent」堪称是对Coding的正式告别——只需一句话,便可实现从「想法」到「产品」的蜕变。

赛博算命,老黄40岁加入佳境?

最近,黄仁勋穿着皮衣在北京的炎炎夏日之下接受采访,可以说火到出圈了。

在现场,让人印象最深的回答之一便是,老黄表示自己已经财富自由25年了,不用为孩子和家人担忧,可以完全投入到自己的事业当中。

那么,「脑洞」来了!

我们是不是可以搞一个「赛博算命先生」,看看能不能算出来老黄的「财运」?

很快,ShellAgent生成了一个生辰八字分析器——只需输入出生年月和地点,就能分析出这个人的运势、五行、事业、婚姻情感等等。

根据ShellAgent自动生成的「信息收集表」,填入出生年月和出生地点就可以了。

接下来,就到正戏了——输入老黄的出生年月日。

从结果来看,这个「算命先生」似乎还可以,说老黄是40岁以后财运渐入佳境。

比现实中稍晚了一些,但差不太多。

既然是「赛博算命」,怎么能少了「看掌纹」这个环节。

随着指令的输入,ShellAgent便自动开始为任务「构思应用名称」,并列出自己的工作顺序。

在右侧,我们可以实时追踪它的任务清单和标记用户旅程的流程图,所有这些都能作为上下文,随时调整!

Prompt:帮我打造一个看手相专家,只需输入手掌照片,就能测算我的运势

依然是端到端的text2app,而且ShellAgent还提供了一个「User Journey」功能,可以通过该功能概览APP的创建过程。

很快,一个看手相APP就构建完成。

并且还可以二次要求,将生成内容转化为「长图」,Agent会再次启动,将新功能生成长图加入到APP中。

最终我们就获得一张手相分析图。

电影经典名场面,看图即猜

一张图,猜出电影名字,ShellAgent也能一键完成搭建。

只需要说一句「看图猜电影AI」,它便立即开始执行了,在构建过程中,会向你提前确认一些细节,包括图片类型、电影范围、交互方式等。

不一会儿功夫,ShellAgent就完成了一款应用。并且,还有一个项目总结,涵盖了核心功能、应用特点,使用方式。

上下滑动查看

在部署前,可以先在右侧对话框中进行测试。比如,上传一张经典剧照,看它能否正确给出解答。

不出所料,AI智能体一次性给出了正确答案——「穿普拉达的女王」。

更令人惊喜的是,它还给出了电影上映年份、导演、主演名字,并且图中三位女演员的名字,以及电影场景中的角色一一给出描述。

另一个国产电影经典名场面,它瞬间解读出了紫霞仙子的意中人。

打工人待办助手,遇事不慌

对于打工人来说,每天要面对繁杂的事,常常应接不暇。

这时,一个能智能规划日程、提醒重要事项的AI助理,就显得尤为重要。

不如,就让ShellAgent创建一个「智能待办事项助手」。

在创建之前,它会告知一些限制,以及可行的替代方案。同样,在执行任务之前,也会事先确认好核心需求。

比如,要求是打造一个会话内待办助手,具备时间管理建议、任务分解建议等功能。

同时还要告诉其,应用场景主要在「日常工作任务管理」,以及通过自然语言输入任务。

在此过程中,ShellAgent主动调用了Claude组件,并可视化了用户交互流程

完整构建流程,如下图所示。

接下来,只需要等待15-30分钟,智能待办事项应用助手就完成了。

这时就可以直接开启测试,把需要待办任务,一一扔给AI。

首先,添加一个「明天下午2点开会讨论项目方案」,它会根据要求,给出优先评级,下一步行动建议。

随后,我们又添加了两项新任务,「傍晚6点去超市买一周的食材」、「晚上9点给朋友或家人打个电话,聊聊近况」。

假设一天的任务全部添加完毕,就可以查看任务列表了。

AI助手会贴心地把一天中所有的任务,根据时间、类别、预计用时等,全部规划完成。

上下滑动查看

若是完成了其中一项,直接告诉其任务编号,AI助手就帮我们打勾了。

这套流程走下来,不得不夸ShellAgent生成的AI助手太强了,人手一个Agent梦想成真。

从这些实测不难看出,完全对话式的(Talk-app)的App创作流程才是Vibe Coding的下一个形态。

无需IDE、无需Coding、甚至无需测试和部署。

就像OpenAI的Codex团队在接受采访中曾提到的,未来的编程就像是刷Tinder,遇到好的需求就「点赞」,遇到不好的就「滑掉」。

ShellAgent带领我们率先进入Vibe Coding 2.0时代

Vibe Coding进入2.0时代

现在,MyShell在X平台上有20多万粉丝,最新推出的Web版本主打的是Vibe Coding 2.0。

未来通过自然语言不仅仅是和AI聊天这么简单。

当大模型的能力不断提升,人类的「自然语言」几乎可以说是变成了一种「咒语」,无所不能。

老黄在欧洲科技月就说未来的编程语言是「Human」。

提出氛围编程的Karpathy在他的个人账号上始终置顶的一句话就是「英语(他的母语)是未来的编程语言」。

自「氛围编程」被提出(Vibe Coding)之后,科技巨头们对于AI Coding这件事就持续加码。

Cursor的百亿估值、Windsurf的狗血收购剧情,都在表明,让编程变得容易更容易确实是一门好生意。

Cursor从零到百亿美金只用了不到3年,这三年就是Vibe Coding呼声最大的三年。

Windsurf更是经历了管理层被连锅端,员工傻眼的,但又迅速被买断的狗血事件。

除了商业,科技巨头纷纷宣布内部代码已经开始由AI生成,谷歌扬言目前50%的代码都是AI生成。

对于编程本身来说,更成为了AI模型的试金石。

不论是闭源ChatGPT、Gemini还是开源的DeepSeek、Qwen、Llama等模型,发布新模型的第一件事情就是找几个编程基准测试一下。

这在过去很难想象。

Vibe Coding已经成为AI时代一种全新的生产范式,一个月100美元的Claude Max、200美元的ChatGPT Pro还有马斯克300美元一个月的SuperGrok Heavy,都在证明氛围编程的潜力。

氛围编程某种意义上是AI时代的创造力载体,就像过去我们的创造力是通过Tiktok、Instagram等短视频载体来表现。

手机、摄像头和网络催生了繁荣社交媒体生态,现在AI时代来了,每个人都拥有了自创产品的能力,一个新时代仿佛在招手。

但冷静下来会发现,目前Vibe Coding(暂且称为1.0时代)依然运行在Cursor等IDE上,距离让普通用户能接触到依然还差了部署和运维的步骤。

这样一来,「编程能力」又回到了少数技术派手中。

顶级程序员借用AI可以达到C罗的身价,而普通人却被Vibe Coding隔离到时代之外。

只有真正的Talk-app范式才能达到AI平权,毕竟人人都会自然语言。

如果能有一个地方,能打通「想法」——「产品」中间的所有步骤,就像AI聊天一样,说句话就能打造一个产品或者APP,那每个人都可以直接将自己的想法具象成可用的产品来分享交流。

AI编程终极钥匙:人类语言

其实提升开发效率,在AI出现以前就是一个很大的「议题」。

比如各种前端框架、后端框架、低代码平台等。

AI出现后,自动写代码带火了Cursor、Windsurf等IDE平台,Cursor更是创下了最快百亿美金估值公司的记录之一。

MyShell的使命是将AI编程的故事再进一步。

就像老黄和Karpathy所憧憬的那样,通过「人类的自然语言」直接生成APP。

当AI的能力能够「吞噬」互联网那个时代的上下游节点,直接接管编码、测试、部署甚至运维。

这就是新时代的TikTok和Instagram,人人都可以分享自己的产品。

从表达自己,到创造世界。

MyShell,就是那把钥匙。

让每个人真正成为创作者的时代,已经到来。

本文来自微信公众号“新智元”,作者:新智元,36氪经授权发布。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!