MiniMax MCP Server 上线 文本输入即可调用 今日,MiniMax稀宇科技宣布其MiniMax MCP Server正式上线。这一创新平台为用户带来了一站式的多模态解决方案,只需简单文本输入,即可调用视频生成、图像生成、语音生成和声音克隆等多项前沿能力,极大地拓展了人工智能在创意内容生成领域的应用边界。平台亮点强大的多模态功能:MiniMax MCP Server支持多种模态的生成能力,包括但不限于视频、图像、语音以及声音克隆。这一功能的实现 AI热点 1月前 0 点赞 0 评论 111 浏览
谷歌DeepMind计划整合Gemini与Veo,打造智能全能助手 在人工智能领域不断创新的谷歌,近日宣布了一项激动人心的计划。谷歌 DeepMind 的首席执行官 Demis Hassabis 在播客节目 Possible 中透露,公司将把其 Gemini AI 模型与 Veo 视频生成模型进行整合。这一举措旨在提升 Gemini 对物理世界的理解能力,助力开发出一个真正能够在现实生活中为用户提供帮助的通用数字助手。Hassabis 指出,从一开始,Gemini AI热点 1月前 0 点赞 0 评论 183 浏览
Kimi 首个多模态功能体验,AI 一键为音乐生成 MV,月之暗面不再只卷长文本 在闭着眼睛听一首歌的时候,你有没有在脑海里想象过,应该搭配什么画面?Kimi 内测的最新功能「创作音乐视频」,就是奔着当 MV 导演去的。长文本领先的 Kimi,默不作声地「跨界」了。APPSO 也受邀首批体验了这一新功能。给 Kimi 一首歌,然后等待几首歌的时间,它就还你一个短视频,能踩点,懂分镜,审美也不错。当 MV 导演,Kimi 真的有点懂行懂王入场曲、川普战歌《YMCA》,谁上头了? 产品评测 2天前 0 点赞 0 评论 79 浏览
谷歌计划将 Gemini 与 Veo AI 模型结合,推动智能助手发展 在近日的一档播客节目中,谷歌 DeepMind 的首席执行官米斯・哈萨比斯(Demis Hassabis)表示,谷歌计划最终将其 Gemini 人工智能模型与视频生成模型 Veo 结合,以提升 Gemini 对物理世界的理解。他指出,Gemini 从一开始就是为了多模态设计的,目的是实现一个 “通用数字助手”,这种助手能够在现实世界中真正帮助用户。哈萨比斯提到,AI 行业正逐渐朝着 “全能” 模型 AI热点 1月前 0 点赞 0 评论 216 浏览