AI新词:OmniAudio - AI学习站

通义大模型发布OmniAudio 可从 360° 视频生成空间音频

AI热点 11月前

通义大模型发布OmniAudio 可从 360° 视频生成空间音频

近日，通义实验室语音团队在空间音频生成领域取得里程碑式成果，推出OmniAudio技术，该技术可直接从360°视频生成FOA（First-order Ambisonics）音频，为虚拟现实和沉浸式娱乐带来全新可能。空间音频作为一种模拟真实听觉环境的技术，能提升沉浸式体验，但现有技术大多基于固定视角视频，对360°全景视频空间信息利用不足。传统视频到音频生成技术主要生成非空间音频，无法满足沉浸式体验

AI中国

AI中国

266 0

热门标签

认知负债审慎对齐物理通用人工智能美国AI创业公司盘点变现 MobilityAI AI自拍评分笔记管理购物体验智能化引擎

热门作者

作者头像

AI科技前沿

102篇文章

作者头像

机器学习笔记

87篇文章

作者头像

AI绘画大师

64篇文章

热门阅读

1

6种AI声音克隆工具，听说还有99%的人不知道（建议收藏）

1990 阅读

2

蛋仔派对：看别人让豆包看图片猜人物，我便让他认一下蛋仔皮肤！

1951 阅读

3

WMS 系统「入库管理」功能详解

1666 阅读

4

速抢（2核2G）77元/年香港免备案服务器

1551 阅读

5

协作机器人HMI优化指南：从示教器到控制软件的可用性与性能升级

1369 阅读

6

YouMind: 你的AI创作新范式

1337 阅读

7

0代码经验，半天时间，我用Cursor从0到1开发了微信小程序并上线，附教程+提示词

1304 阅读

8

AI制作ASMR视频也能火爆全网，沉浸式切水果视频教程

1257 阅读

9

教运营使用DeepSeeK+ECharts画桑吉图

1223 阅读

10

可口可乐，你浓眉大眼的也用AI做广告了？

1117 阅读

11

分享4个超简单的DeepSeek提示词公式，让你的DeepSeek秒懂你

1093 阅读

12

即梦AI图片3.0智能参考图指南，也能一句话做出爆款设计了

1041 阅读

13

怎样才能制作出一个数字人？一分钟教你完成AI数字人制作

979 阅读

14

别再花钱去拍形象照了，教你一键制作大师级人物摄影照

940 阅读

15

扣子节点文本转Word攻略：4步搞定，告别手动排版！

917 阅读

16

全新SkyReels正式上线

909 阅读

17

拼多多直通车优化技巧

869 阅读

18

我用一张表格，把带娃从“鸡飞狗跳”变成“母慈子孝”！

867 阅读

19

靠AI做美食图？小白也能轻松制作出让人垂涎欲滴的美食照片

860 阅读

20

我用腾讯3D Studio让原神的芙宁娜活了，能跑还能打

828 阅读