AI热点 3月前 35 阅读 0 评论

微软 Copilot Studio 新增“计算机使用”工具

作者头像

AI技术专栏作家 | 发布了 246 篇文章

Microsoft Copilot Studio 使企业能够通过直观的图形界面创建自定义 AI 助手和虚拟代理。创建完成后,这些助手和代理可以直接在 Copilot Studio 中进行测试和发布。

微软 Copilot Studio 新增“计算机使用”工具
微软 Copilot Studio 新增“计算机使用”工具

今天,微软宣布在 Copilot Studio 中推出一款名为“计算机使用”的全新研究预览工具。该工具允许 Copilot Studio 客服人员与任何网站或桌面应用程序进行交互,就像它们本身就是工具一样。客服人员现在可以点击按钮、选择菜单,并在应用程序和网站上的字段中输入信息。全新的“计算机使用”工具使客服人员能够在没有可用 API 进行编程集成的环境中运行。

“计算机使用”基于大型语言模型 (LLM),可以自动适应应用程序和网站的变化。据微软称,该工具包含内置推理功能,可以自主解决问题。

为了确保“计算机使用”工具适用于企业,它在微软托管的基础架构上运行,从而无需组织管理自己的服务器。微软强调,客户数据将保留在微软云边界内,并且不会用于训练大型语言模型。

微软强调了“计算机使用”工具增强机器人流程自动化(RPA)的以下方式:

  • 它实时响应变化:当按钮或屏幕发生变化时,该工具会继续工作而不会中断您的流程。

  • 它易于使用:您可以用自然语言描述您想要的内容,无需编码,并使用计算机使用推理链和计划的 UI 自动化的实时并排视频来测试和完善提示。

  • 它是用智能构建的:代理可以看到屏幕上的内容并实时做出明智的决策,即使在复杂或不断变化的环境中也是如此。

  • 它具有完整的可见性:制造商可以随意查看计算机使用活动的历史记录,包括捕获的屏幕截图和推理步骤。

今年年初,OpenAI 宣布推出Operator,它采用了计算机使用代理 (CUA) 模型,将 GPT-4o 的视觉功能与通过强化学习实现的高级推理能力相结合。微软或许正在利用 Operator 背后的相同底层技术,为 Copilot Studio 中的这款全新“计算机使用”工具提供支持。

感兴趣的组织可以填写此表格以获得微软的邀请来试用这个新工具。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!