亚马逊推出AI语音模型Nova Sonic：价格比GPT-4o便宜80%

快科技

AI技术专栏作家 | 发布了 246 篇文章

快科技4月9日消息，亚马逊正式推出新一代生成式AI语音模型Nova Sonic，标志着其在人工智能语音领域取得重大突破。

这款创新模型能够原生处理语音输入并生成自然流畅的语音输出，在速度、语音识别准确率和对话质量等核心性能指标上，已达到与OpenAI、谷歌等科技巨头的尖端语音模型相媲美的水平。

Nova Sonic通过亚马逊Bedrock开发者平台提供服务，采用创新的双向流式API接口，为企业级AI应用开发提供了强大支持。亚马逊特别强调，该模型在成本效益方面具有显著优势，其价格比OpenAI的GPT-4o便宜约80%。堪称目前市场上最具性价比的AI语音解决方案。

与竞争对手的AI语音模型相比，Nova Sonic在将用户请求路由到不同API方面表现出色。这一能力使得Nova Sonic能够知晓何时需要从互联网获取实时信息、解析专有数据源，或者在外部应用程序中采取行动，并使用合适的工具来完成任务。

在双向对话中，Nova Sonic会等待合适的时机”发言，会考虑到说话者的停顿和打断等情况。此外，Nova Sonic还能够为用户的语音生成文本记录，开发者可以将这些文本用于各种应用场景。

亚马逊AGI部门首席科学家罗希特?普拉萨德透露，Nova Sonic的部分技术已经应用于升级版数字助手Alexa 。该模型的推出是亚马逊构建人工通用智能（AGI）战略的重要一步，未来还将推出支持多模态理解的AI模型，涵盖图像、视频及其他物理世界感知数据。

（举报）

登录账号

亚马逊推出AI语音模型Nova Sonic：价格比GPT-4o便宜80%

AI前线

评论 (128)

AI爱好者

开发者小明

AI前线作者

科技观察家

文章章节

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

用户破8亿！GPT-5.1来了，表情包含量可自定义

发布即开放：百度猎户座葫芦里卖的什么药？

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

速抢（2核2G）77元/年香港免备案服务器

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

小鹏物理AI的尽头，是马斯克的现金流

热门标签

热门作者

AI前沿

机器学习实验室

AI创业圈

登录账号

亚马逊推出AI语音模型Nova Sonic：价格比GPT-4o便宜80%

AI前线

评论 (128)

AI爱好者

开发者小明

AI前线 作者

科技观察家

文章章节

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

用户破8亿！GPT-5.1来了，表情包含量可自定义

发布即开放：百度猎户座葫芦里卖的什么药？

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

速抢（2核2G）77元/年香港免备案服务器

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

小鹏物理AI的尽头，是马斯克的现金流

热门标签

热门作者

AI前沿

机器学习实验室

AI创业圈

AI前线作者