AI热点 10小时前 104 阅读 0 评论

ShellAgent 2.0实测,不写UI执着产出可交互App的偏科战神

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

ShellAgent 2.0,


没有选择卷复杂华丽的前端页面,而是闷头把后台交互卷到极致。


也就是说,我们写生成应用提示语的难度降到了有嘴就会的级别。


一句话生成


Three.js、CDN、Tailwind Nextjs、JavaScript等一大堆专业名词都不用记了,只需要说:


开发一个应用,能上传PDF,总结内容,并将其转化为播客。



它就开始kuku一通分析了,


先理解我的需求,从需求里面提取出核心功能,然后从自己的组件库里面找到能用的,


接下来就开始模拟跟我的交互流程,以及代码生成计划了。




生成前的最后一步,ShellAgent还会确认更多的细节,


最右侧页面会有文字版的执行进度,以及流程图形式的实时构建过程。



这个就是PDF转中文播客的本体了,


🔗 app.myshell.ai/bot/yIf2Yv



目前ShellAgent是支持三个任务同时运行的,不需要一个个等。


执行过程中遇到bug也不用担心,点击「Fix with ShellAgent」,就能一键修复。这里的修改是会按照最小原则来的,不会破坏原有的需求。


我这里就是因为获取100个帖子超过模型上下文了,它给我调出成25个,一个更合适的数目。



垂直API整合


除了多模态交互,文本转语音、文本转图像、图像转图像等方式,


ShellAgent还擅长把各种API整合在一起,第一个case是它的舒适区,


那第二个case我让gpt选了一个比较冷门的垂直领域方向,


创建一个招聘信息整合平台,从 AngelList 抓取与 AI 相关的职位信息,按照远程友好性和薪资进行筛选,并输出一份精选职位列表。



生成出来的应用会解析这个API需要的参数,这里是api key、职位工作内容、工作地、最低工资和技能水平等等。


Remix模式


甚至提示语都可以不要,ShellAgent还有Remix模式,


可以把自己做过的App换成别的风格,



也可以看到别人公开的好看应用的话,


几句话改改就可以变成我想要的样子,@藏师傅的运势推算App效果蛮不错的,支持多参数输入、输出报告,还能输出海报。


很好,现在是我的了(狗头保命),我也不需要知道提示语。



在 Remix 模式下,我想把16人格的也加进去看看。


把16人格的运势推算也加进去



十道题可以测试16人格加上本周运势,作为一个从ENTJ转到INFJ的人来说,我只想说这里就差一个星座就能集齐库里南碎片。


写在最后


就是那么简单。


ShellAgent 不需要你提前准备什么,


它本来就是给“不知道怎么做但想试一试”的人准备的。


你不用学提示语,不用懂组件,甚至都不用打开 VS Code。


了解ShellAgent最好的方法,就是直接上手试。


把你想要的,原样敲进去就行了。


别修饰,别优化,也别担心“这个需求是不是太蠢了”。


你说得越直白,它越听得懂。


它不是让你变成开发者,


它是让你,不用变成开发者,也能做点什么出来。


所以,如果你脑子里刚好有点什么,


别管它是不是 idea,


打开 ShellAgent,


试试看,它会给你个惊喜。


🔗 app.myshell.ai/robot-workshop



文章来自于微信公众号“卡尔的AI沃茨”,作者是“AI沃茨”。


作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!