多模态 - AI学习站

AI热点 6月前

蚂蚁集团发布多模态应用“灵光”，内置AGI相机，已开启内测

据新浪科技消息，近日，一款名为 “灵光” 的全新多模态应用已在腾讯应用宝、vivo 应用商店等平台悄然上线，并开启邀约内测。用户可通过手机号或支付宝账号直接登录体验。据悉，“灵光”由支付宝（杭州）数字服务技术有限公司开发，其最大亮点在于内置的 “AGI 相机” 功能。这一功能可通过相机镜头识别并理解现实世界中的场景与内容，实现拍摄即问、实时理解与回答。有业内人士指出，该功能与字节跳动的豆包 A

AI中国

AI中国

257 0

Freepik重磅接入Seedream 4.0！Premium+会员无限生图

AI热点 7月前

Freepik重磅接入Seedream 4.0！Premium+会员无限生图

全球知名设计资源平台Freepik近日正式上线字节跳动Seedream4.0图像生成模型，这一升级将AI生图能力无缝集成到其创意工具中，为设计师和创作者带来革命性体验。作为豆包大模型家族的最新成员，Seedream4.0支持多模态输入输出，生成质量和速度均达业界领先水平。更吸引人的是，Freepik的Premium+会员可享无限生成次数，这一福利被誉为“太香了”，预计将进一步巩固平台在AI设计领

AI中国

AI中国

178 0

Flux Kontext 高级技巧揭秘：多图融合、虚拟试穿、AI产品展示，效果炸裂！

视频教程 10月前

Flux Kontext 高级技巧揭秘：多图融合、虚拟试穿、AI产品展示，效果炸裂！

AI中国

AI中国

240 0

MiniMax MCP Server 上线文本输入即可调用

AI热点 1年前

MiniMax MCP Server 上线文本输入即可调用

今日，MiniMax稀宇科技宣布其MiniMax MCP Server正式上线。这一创新平台为用户带来了一站式的多模态解决方案，只需简单文本输入，即可调用视频生成、图像生成、语音生成和声音克隆等多项前沿能力，极大地拓展了人工智能在创意内容生成领域的应用边界。平台亮点强大的多模态功能:MiniMax MCP Server支持多种模态的生成能力，包括但不限于视频、图像、语音以及声音克隆。这一功能的实现

AI中国

AI中国

244 0

谷歌搜索 AI 模式扩展至 35 种新语言与 40 个新国家

AI热点 6月前

谷歌搜索 AI 模式扩展至 35 种新语言与 40 个新国家

谷歌宣布AI 模式（AI Mode）将向全球更多用户开放，支持超过35种新语言和40个新国家及地区的使用。这意味着，AI 模式将覆盖超过200个国家和地区，包括许多欧洲国家，越来越多的人将能够使用他们的母语进行搜索。谷歌的最新 Gemini 模型为搜索引擎带来了更强大的功能，用户可以用最自然的方式提出问题，充分利用自然语言理解和多模态能力。随着更多人能够使用自己熟悉的语言进行搜索，谷歌希望提升用户

AI中国

AI中国

242 0

国产AI视频模型全球登顶！不用买Veo3啦～

视频教程 9月前

国产AI视频模型全球登顶！不用买Veo3啦～

AI中国

AI中国

186 0

Veo 3 与可灵2.1 效果对比，你认为谁会赢？多模态大模型

产品评测 10月前

Veo 3 与可灵2.1 效果对比，你认为谁会赢？多模态大模型

AI中国

AI中国

291 0

谷歌计划将 Gemini 与 Veo AI 模型结合，推动智能助手发展

AI热点 1年前

谷歌计划将 Gemini 与 Veo AI 模型结合，推动智能助手发展

在近日的一档播客节目中，谷歌 DeepMind 的首席执行官米斯・哈萨比斯（Demis Hassabis）表示，谷歌计划最终将其 Gemini 人工智能模型与视频生成模型 Veo 结合，以提升 Gemini 对物理世界的理解。他指出，Gemini 从一开始就是为了多模态设计的，目的是实现一个 “通用数字助手”，这种助手能够在现实世界中真正帮助用户。哈萨比斯提到，AI 行业正逐渐朝着 “全能” 模型

AI中国

AI中国

307 0

AI热点 6月前

Adobe AI Foundry 推出定制化服务，为企业打造独特的 Firefly 模型

Adobe 最近宣布推出一项新服务 ——Adobe AI Foundry，旨在为企业客户提供定制化的 AI 模型 Firefly。通过这一服务，Adobe 将与企业合作，重新架构和再训练 Firefly 模型，以满足客户的特定需求。这些 Foundry 版本的模型与普通的定制 Firefly 模型不同，它们能够理解多个概念，而普通模型则仅限于单一概念。此外，Foundry 模型是多模态的，具备更广

AI中国

AI中国

118 0

Grok 4：多智能体协作推理模型

视频教程 8月前

Grok 4：多智能体协作推理模型

AI中国

AI中国

169 0

热门标签

快乐猪(PIG) AIPC 技术决策特斯拉FSD AI扫描识别 ListenLabs 自制情趣机器人广告大模型智能厨电

热门作者

作者头像

AI科技前沿

102篇文章

作者头像

机器学习笔记

87篇文章

作者头像

AI绘画大师

64篇文章

热门阅读

1

6种AI声音克隆工具，听说还有99%的人不知道（建议收藏）

918 阅读

2

AI制作ASMR视频也能火爆全网，沉浸式切水果视频教程

760 阅读

3

【SD绘画教程】5月最新StableDiffusion保姆级全套教程+SD必备插件模型——秋叶SD零基础入门到精通 AI绘画出图全流程教学实战（附SD安装包）

734 阅读

4

蛋仔派对：看别人让豆包看图片猜人物，我便让他认一下蛋仔皮肤！

704 阅读

5

AI副业带货轻松变现，0基础3分钟搞定图文全流程！

700 阅读

6

【全108集】2025 最新发布！即梦AI3.0独家保姆级教程来啦！AI绘画+图生视频+脚本+剪辑完整流程详解！设计师必学的首款AI软件，按头就能学会

690 阅读

7

教运营使用DeepSeeK+ECharts画桑吉图

680 阅读

8

【拒绝人工智障！】为什么DeepSeek这么牛逼，到你手里却稀烂？三招教你把deepseek训练成你的私人AI助理，零基础小白轻松搞定大模型，我奶奶都能学会

657 阅读

9

【AI绘画】StableDiffusion插件之NSFW审查（瑟瑟审查）安装使用教程

605 阅读

10

分享4个超简单的DeepSeek提示词公式，让你的DeepSeek秒懂你

544 阅读

11

MegaTTS3 V3版 - 去除上传npy限制真开源! 字节高保真语音克隆、文本转语音软件支持50系显卡本地一键整合包下载

522 阅读

12

360 AI 浏览器来了！免费用 AI 还能剪视频？

520 阅读

13

即梦AI图片3.0智能参考图指南，也能一句话做出爆款设计了

506 阅读

14

Deepseek做表情包！首月变现！电脑操作有手就会~

500 阅读

15

如何免费使用VEO3？绝对不能错过的攻略

488 阅读

16

速抢（2核2G）77元/年香港免备案服务器

475 阅读

17

【AI绘画教程】专为电商设计师打造的StableDiffusion入门教程，从0到1掌握AI绘图+商业落地系列SD教程！基础入门+实战案例，一周掌握SD

474 阅读

18

怎样才能制作出一个数字人？一分钟教你完成AI数字人制作

460 阅读

19

WMS 系统「入库管理」功能详解

438 阅读

20

突破性更新！Vidu1.5让AI视频保持角色一致性从未如此简单～

422 阅读