产品评测 21小时前 166 阅读 0 评论

横评首款地产Agent,每个行业都该有个自己的垂类AI

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

快到7月份了,


一年一度,准时准点,让我需要在工作日顶着大太阳,穿梭在各大小区,一天爬五十几层楼梯的固定任务要刷新了:


用人话说,租的房子快到期了


预算有限,想要空间大一点、通勤方便一点、离夜宵近一点,99.99%的情况下,我会在高强度的搜索、对话、约线下后,跟某个小区楼下的某家店的某个笑容满面,打算收我一个月中介费的中介碰面。


然后,在38度的天气,半蹲着在中介的小电驴上逛一下午,结果因为图片与实物相差极大,空闲时间有限,只能将就。



没想到这个问题在今天这个时间节点就能被 Agent 解决大部分。房地产走出来了首款垂类 Agent:


CRIC 深度智联


🔗 dichanai.Com



为了能够待在空调房里,我赌上全部的 token,今天就来横向对比一下,联网版OpenAI o3、通用 AgentManus和垂类 AgentCRIC 深度智联,哪一个能完成这类复杂任务,Here we go!


01|搜索


第一轮是解决前期信息搜索,


> 我在杭州余杭工作,预算在4000-5000一个月,近地铁,点外卖、附近有绿植,不要用大型的建筑工地或者近期有翻新计划的,推荐几个合适租房区域,以及它们的户型图,我是两个人住,希望至少有两个房间。


CRIC 深度智联目前有四个功能:搜索、文章、报告,以及知识库。先从看看它的信息源,直接是对接了克而瑞、安居客、房天下等一线平台、甚至是杭州住房保障和房产管理局住房租赁公众服务平台,



从回答上看,第一部分的回答准确告知了我对应的小区,给出了交通便利性、绿植环境和推荐房源,我可以直接从引用的信息来源直接跳转。



回答的第二部分真的就是属于之前不到线下看都不会知道的信息,因为现在很多房源都是上传同一张户型图,第一次租房非常非常非常容易被误导。



都是适中,我人都傻了


对我来说最有说服力的点是因为我就住在这三个区域里的一个,甚至连户型都一模一样,当时我花了两周找房子,自以为已经是最优选择了,没想到几分钟就被找出来了。



还有施工区域的信息,我真的强烈建议像我一样因为周边设施和绿化,喜欢住老小区的朋友,在租房前都看看会不会有施工计划。每天八点准时打水泥的日期我只撑了三个月。。。


来看看 Manus 吧,


它一开始也是先找了地铁路线图,缩小了范围之后,就直接开始在租房网站上查询信息了,


但是,要说但是了,


可能是因为云端环境的问题,Manus 前后访问了安居客、贝壳找房、链家、自如、58同城,都被人机验证卡住了,就算是我手动通过,还是会重新卡住。



前前后后跑了快一个小时,我这里将回放记录也贴上来了。换到第五个租房网站的时候我自动停止了,1000积分都烧走了,用不起用不起。。。


🔗 manus. im/share/RT8cyB3Z7ZwSRSt1STuNFR?replay=1


轮到 OpenAI o3 了,


也就是 o3-pro 太慢了,不然直接模型拉满。


这次测试其实有去掉一部分我对联网搜索的“偏见”,就不应该还停留在中文信息搜不到,或者只有Deep Research才能打的印象。从思考过程里看到覆盖的网页已经很全面了,连某抖都有。。。



o3输出的结果比较简洁,


找到的小区户型图里有部分失效的图片。我很关注的大规模拆迁和烦心规划是因为没有找到对应的信息源才得到的结论,这一点的可信度就没那么高了。



02|文章


第二轮来试试看更复杂的专业文章场景,


> 我最近有在关注杭州的二手房市场,请提供一份专业的选购攻略,我希望在90~110方,预算是200万~300万,小区宠物友好,有停车位,最好是最近10年的小区,邻近学校,物业态度好,楼层在5-10楼之间


比起租房,二手房购买基本上做攻略都能耗掉我小半年的时间。


在文章开始生成前,我可以自由更换写作主题,文章生成后还可以换排版、写作风格、标题和加语音解说。



写作的过程中,CRIC深度智联会额外考虑到房龄、交通、生活配套(医院、公园、商圈)、是否限购等等,


而且考虑到我可怜的钱包,它还将地铁线路规则纳入了未来房价价值的影响因素。



而跟普通的AI写作工具不同,


CRIC 深度智联已经把公众号接入自己的知识库了,



而且在写作之前的最后一步,还会将素材按照格式分类成文字、图片、表格,数量多到是两张图都不够截的。



这些素材最终会链接成一个脑图。



有没有对杭州房价比较熟的朋友来评价一下这份文章的准确度?以及推荐的这几个小区值不值得买?



OK,来看看 Manus 做的怎么样,这次我告诉它可以绕开一些需要验证的链接,不过这变相导致了它能参考信息变少了,



从成品文章来看,Manus 同样准确完成了我的需求,给出了合适的小区,还解读了购买的条件、成交量、带看量和挂牌量等等,同时也给出了购房全流程。但是因为没有具体的数字,我阅读起来的记忆点没那么多,可信度也没想象强。


🔗 manus. im/share/hy6sucLtgmt07jMc9tLmHx?replay=1


再一次轮到 OpenAI o3 了,


任务难度上来了之后,干扰信息源就变多了,




o3 输出的结果就不太算是一个完整的文章,更像是一个概要。


这也是联网搜索遇到复杂问题时候暴露的一个缺点,大部分模型因为要回答所有的问题,在输出的时候每一part的篇幅都很少,尤其在陌生领域,虽然总结出了一些我不知道的知识点,但浅尝而止。我需要额外追问。



03|报告


第三轮来试试看专业级别的任务吧,


> 我想知道杭州楼市是不是已经触底,梳理杭州近6个月政策变化与市场反应,结合社交媒体情绪和同类城市对比,判断其房地产市场当前所处周期,并预测未来3-6个月的价格、成交与信心趋势。


谢谢 OpenAI o3 帮我梳理出了这个有点子专业术语的提问。


CRIC 深度智联这次的交互方式用的就是自由画布了,通过思维链的方式,提取我问题里面的关键词主题元素,并行运行多个素材收集的任务:



然后会将多个关键词主题重新组装成一个大的报告主题,并一次性生成两种不同形式的报告:文本报告可视化报告


两者侧重点不同,文本报告更加侧重于把事说全,内容高度概括了收集到的素材,



可视化报告侧重于把事说透,大量的可交互图表让我可以在短时间内抓住整个报告里我最想了解的重点,



又又又来到 Manus 的环节了,


这次的问题是它的舒适区,万字报告的生成不是问题,生成的质量我跟CRIC 深度智联的输出的结果来了一圈相互对比印证,信息准确度其实差不多,


Manus 擅长的点是按照时间轴来整合时间,所以在城市之间的对比,以及是否触底的预测都可以给出了相当自洽的结论。但Munas给的是一个纯文档,这么多这么多字,真的我要下定很大的决心才能仔细看完。



CRIC 深度智联则给出了很多搭配的数据表格,并且把重点信息都高亮出来,让人一下就get到重点,可阅读性更高。



🔗 manus. im/share/HmxtpuDXjVZZg2LahoEgBL?replay=1


o3这轮表现如何呢?这一趴里我给它给了一个小灶,



可惜的是输出的形式还是分段太多,就像是一个简单的概要,



这两次对比也能看出垂类Agent输出报告的便利性,我不用为了一些重要的数据,反复跳转信息源做人工验证。


除了上面提到的三个功能,在CRIC深度智联里还可以创建自己的知识库,写文章、报告的时候使用自己的写作风格,



最后最后,叠个甲,


由于我也是个房地产小白,上面的提问和回答结果并不是购买建议。


感兴趣的朋友们还是结合自己的实际的信息,尝试跟CRIC 深度智联深入多聊一段时间,相信会收获到不少有用的信息。


04|从 1.0 到 2.0


如果是对地产Agent关心的朋友,


应该会留意到CRIC 深度智联已经上线两周多了。那为什么我会把横评的时间拉那么长呢?早在他们5月份上线1.0的时候,我就从朋友圈看到了。


当时做一份《杭州2025年5月份房地产市场月报》的结果长这样:


从信息的排版,以及可视化图表的数量上看已经超过大部分通用联网搜索了,但是他们在不到一个月的时间就卷出了2.0。。。


直接输出一份可以直接当付费报告级别的PDF:



是肉眼就可以看出明显区别,2.0的报告在地产专业性上已经比manus好不少了。信息和数据分析都更详细具体,而且像对住宅市场的分析角度对比1.0更为广泛。


这段时间使用各类Agent下来,能感受到更垂更专业的版本是更难做的,这个难在于对于这些垂直内容的数据库、知识库的搜集训练,并且能够链接到对于这个行业的判断思维。


在AI渗透我们生活方方面面的这段时间,简直是Agent大爆发,有像做广度的通用Agent,有做专一内容深度的像CRIC深度智联这样的垂类Agent,

而我在用过很多之后的感受是,它们相辅相成。我们在合适的场景选择合适的助手,就能发挥更大的优势,解决我们的问题。


写在最后


当我作为小白的时候,最怕的就是信息不对称。


真的,走到哪里都怕被坑。


以前只靠经验贴、社群问答、某书搜索总结一个大概的方向,但现在,我们可以拥有一个自己的地产顾问。


Agent 的发展方向,比我想象的还要广泛、还要快,


但这就是趋势,


各行各业都在AI,


这是好事,


因为我再不用听中介吹的天花乱坠,


再不用在38度的天气蜷缩在小电驴后座没什么想法的被带着乱跑。


行情已经提前在我的脑子里准备好,


减少信息差、被坑几率减小,


就是最好的事情。


文章来自于微信公众号“卡尔的AI沃兹”。


作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!