大家好,我是袋鼠帝
最近发现滴滴出手了!入局打车MCP
我还挺感兴趣的
于是找朋友帮忙开了白名单拿到了一个内测apikey
https://mcp.didichuxing.com/
独乐乐不如众乐乐,这次的邀请码在评论区哦~
用滴滴的MCP接入了苹果,快速打造了一个能通过Siri,用嘴打车的Agent。
效果如下(有两段视频,第二段视频在56秒):
n8n工作流接入的是昨晚发布的DeepSeek V3.1
可以准确定位出发地和目的地,当我只提到想去哪时,会自动获取当前位置作为出发地。
还挺好用的,至少,对于我来说,解放了双手,优化了我的人机交互。
特别是在外面买了一堆东西,腾不出手的时候,手机放兜里,我就能直接:
"嘿 Siri,我想去xxx,给我找个专车,或者最便宜的车",直接就自动打车了,还会给你勾选好车型,省得我再去找,贴心又方便。我只需要最后拿起手机确认一下,点击下单就ok了。
下面是我的心路历程,也涵盖了教程,希望对大家有帮助。
滴滴的MCP-Server支持Streamable HTTP协议,所有请求基于JSON-RPC 2.0进行流式通信。
https://mcp.didichuxing.com/mcp-servers?key=YOUR_API_KEY
为了快速看到效果,我先把滴滴MCP接入了Claude Code
使用下面这个指令就能一键接入
claude mcp add --transport http didi-server "https://mcp.didichuxing.com/mcp-servers?key=你的apikey"
接入成功的效果如下图
这时我们进入Claude Code,输入/mcp 回车,就能看到didi-server已经接入成功啦~(前提是有小绿钩)
直接发给它一个我经常打车的路径,从长水机场T1航站楼B2的地下停车场打车到长水中心集贸市场(因为这里有个电车的免费停车场)
之前我傻傻的把车停到机场停车场,出差几天回来,停车费高达200左右,心痛!
很快接入DIDI MCP的Claude Code就给了我2个链接(App和小程序的),还贴心的给了预估价格。
我用微信打开这个链接,直接就跳转到了滴滴打车小程序
它给的预估价格误差不大,让我有点惊喜的是,它修正了我的上车点:
我在Claude Code提出的要求:昆明机场T1航站楼的B2停车场上车,而长水机场统一的网约车上车点在B3层,它就帮我把上车点修正到了B3层,所以这一点体验还挺好的。
为了方便查看DIDI MCP有哪些工具
我又把它接入了Cherry Studio
在工具栏里面,可以看到DIDI MCP有三种工具
map_textsearch:根据传入的关键词和城市,搜索出相关的POI地点信息
wyc_estimate:查看当前可用的网约车车型
wyc_new_order:根据选定品类呼叫对应车型,可以同时呼叫多个品类
由于最近经常出差(参加各种AI类的活动),打车比较频繁,滴滴打车用习惯了,所以基本上都用的它。
用滴滴打车,要么打开微信->我的->服务->滴滴出行,然后输入目的地,选择车型,点击确认
要么直接下拉,找到滴滴小程序,打开,输入目的地,选择车型
emmm,我就在想,有了滴滴MCP之后这个过程能不能再简单一点呢?
脑子里面蹦出来一个想法,能不能绕过任何App,用嘴说要去哪,就能直接打车啊!
我想到了苹果的Siri,我想动动嘴,就能让Siri帮我打车
说干就干!
我思考了一下,要把DIDI MCP接入苹果的Siri,需要额外增加两个东西:
1.一个接入了DIDI MCP的在线Agent;
2.配置一个苹果的「快捷指令」跟Agent对接;
Siri可以唤起「快捷指令」,「快捷指令」里面调用在线Agent的API接口,获取小程序链接,「快捷指令」自动用微信打开小程序链接,就能实现用嘴打车~
在线的Agent我第一个想到的是我的老朋友:Fastgpt(后面又换成n8n了),Fastgpt相对轻量,好用,而且刚好也支持接入外部MCP工具
在Fastgpt->工作台->新建->MCP工具集,就可以添加MCP工具,如下图这样添加即可。
然后在Fastgpt里面创建一个Agent(简易应用),把DIDI MCP接入这个Agent。
我的设想是这样的:由于我没有滴滴App(主要是手机内存告急了..),所以我只需要DIDI MCP最终给出的小程序链接。
我在Fastgpt设置了输出格式为json_object,然后系统提示词(如下图)里面约束了只输出json格式的链接。
我测试了一下,它确实按照要求,最终输出了json格式。
但是当我测试Fastgpt这个Agent的接口,发现不对劲
接口里面把多余的文字也返回了...
现在我们来捋一下,接下来要在苹果的「快捷指令」里面,调用这个Fastgpt简易应用的API,拿到返回结果后,还得单独在「快捷指令」处理提取链接。
而且还得在「快捷指令」一层一层的拿到接口返回的content字段,总之比较繁琐..
而且我对「快捷指令」并不熟悉,稍微复杂一点的流程,都不适合用它处理。
突然想到了另一个老朋友:n8n工作流
所有繁琐的操作完全可以在n8n里面处理,快捷指令只需要调用n8n工作流的API就行。
于是,我在n8n迅速搭建了一个简单工作流(写着写着,发现DeepSeek V3.1发布了,n8n的模型就用DeepSeek V3.1来试试)
本来我以为还要添加一个代码节点来提取小程序链接的,不过n8n的强大,超出了我的预期,只需要在Agent添加一个output parser节点,就能稳定的约束输出格式了
刚出的DeepSeek V3.1,我明显感觉在指令遵循上又较大提升,之前我在n8n里面试过DeepSeek V3,并不能很稳定的按照给定的json格式输出。
这个工作流的源文件,我放在评论区置顶了,感兴趣的朋友在评论区自取(记得三连支持一下哦~)
另外,不清楚n8n怎么接入外部MCP工具的朋友,可以看下我之前写的这篇:
n8nMCP用法
袋鼠帝,公众号:袋鼠帝AI客栈
斩获86K Star!最强开源MCP平台【双向+本地MCP】自由度拉满,太绝了~
下面是在iPhone上配置好的打车「快捷指令」
整个流程是:
唤起Siri,说"打车",进入快捷指令,说出目的地,获取文本->获取当前位置->提取当前位置的经纬度->组装请求参数(作为n8n工作流中Agent的User Prompt),同时进行编码(否则n8n收不到参数)->向n8n发送请求->获取返回结果->从返回结果中提取小程序链接->用默认浏览器打开链接,就能跳转到滴滴微信小程序啦~
因为「快捷指令」叫"打车",所以唤起Siri之后,要先说"打车",才能调取这个快捷指令
打车「快捷指令」也放在评论区置顶了,跟n8n工作流是配套使用的,感兴趣的朋友评论区自取。
快捷指令中「关闭Siri并继续」的步骤非常关键,因为请求Agent执行稍微有点慢,Siri超时之后就会报错,会导致整个流程中断,而「关闭Siri并继续」很好的解决了这个问题(也是我花了不少时间发现的)
大家拿到并导入快捷指令到手机后,只需要把请求地址(也就是?content前面那串)改成自己的n8n webhook地址即可。
测试的时候需要点击Excute Workflow,让工作流处于监听状态,这样才能接收到请求,每次都要开启监听。
工作流发布(active)之后,记得把「快捷指令」中的请求地址换成Production URL
我使用的是本机的局域网IP来进行测试,手机和电脑要连同一个wify,记得N8N_HOST要改成局域网IP(如果是用公网的话,改成公网IP或者域名)
同时,我还在n8n的Agent里面添加了一段系统提示词:
# 角色
你是一个出行程序。
# 任务
根据用户「用户要求」和「当前位置」,判断起点和终点。并调用打车相关工具,帮用户打车。
# 核心规则
1.终点:直接从「用户要求」里提取。
2.起点:
- 如果「用户要求」明确说了起点(如“从公司出发”),就用它。
- 如果没说起点(如“去机场”),就必须用我提供的「当前位置」经纬度。
这样,当我们的描述中出现了出发地时,就用我们说明的位置作为起点,如果只说了要去哪,那么就用「快捷指令」中获取的当前位置作为起点。
更灵活了,哈哈哈。
如果把n8n这套工作流部署到云服务器
那么,随时随地都可以用Siri来打车啦
比如,后面我再出差回来,即将到达长水机场B3层前,我就可以告诉Siri,我要从B3层到长水集贸市场,给我选最便宜的车型,提前呼叫网约车。
对我来说,确实更方便了
最后给大家留个作业:就是在打开小程序链接之后,弹个提示音,提醒你打车成功,该去确认,并呼叫司机啦!
其实从AI爆火之初,我就在想,人类似乎并不需要那些App,如果AI能直接帮我们做事(定酒店,打车,订机票等等),我们干嘛要去用那些操作繁琐的App呢,有时候一个功能要找半天,就很反人类。
在不久的将来,AI必定会重塑人机交互的方式,最直接的就是从原来的屏幕上点点点,到口喷需求,真正的解放双手。
等脑机接口成熟后,我们甚至可以"心想事成"。
而MCP,就是那个链接AI与万千服务的关键接口,是AI消灭App的重要工具。
这也是为什么大家都抢着构建,并开放自己的MCP。
因为MCP代表着未来全新的人机交互。
而滴滴MCP入局,不仅填补了AI打车的空白,还加速了整个变革的进程。
讲真,这样的未来,真的泰裤辣!我无比期待~
文章来自于微信公众号“袋鼠帝AI客栈”,作者是“袋鼠帝”。