文本转语音

Resemble AI开源TTS Chatterbox ,性能直逼超越ElevenLabs

近年来,文本转语音(TTS)技术在人工智能领域的应用日益广泛,从智能助手到内容创作,TTS正在重塑我们与声音交互的方式。一款名为Chatterbox的开源TTS模型横空出世,凭借其卓越的性能和创新功能,迅速成为行业焦点。Chatterbox:开源TTS的革命性突破Chatterbox由Resemble AI开发,基于MIT许可证完全开源,允许开发者自由使用和修改。这款模型基于0.5B规模的LLaM

ElevenLabs推出V3声音模型:支持70多种语言,可通过标签控制情感、语气

全球领先的 AI 语音技术公司 ElevenLabs 正式发布了其最新文本转语音模型 Eleven v3(Alpha 版),被誉为迄今最具表现力的 AI 语音模型。这一突破性进展不仅提升了语音合成的自然度和情感表达能力,还为内容创作者和开发者提供了更强大的工具,助力视频、音频书和多媒体工具的开发。技术突破:更自然的对话与情感表达Eleven v3引入了全新的架构,能够更深入地理解文本语义,显著提升

Kyutai Unmute 发布!10秒定制语音,AI对话进入超低延迟时代!

法国 AI 实验室 Kyutai 近日推出了一款革命性的语音 AI 系统 Unmute,为文本大语言模型(LLM)赋予了强大的语音交互能力。这款高度模块化的语音模型以其智能对话、超低延迟和个性化定制功能引发业界热议。AIbase 综合整理最新信息,带您深入了解 Unmute 的技术突破与应用前景。模块化设计:为任何文本模型“加声”Unmute 的核心亮点在于其高度模块化的架构。开发者无需重新训练模

地表最强AI语音来了!Eleven v3 Alpha版震撼发布,会说话还能“演戏”

随着人工智能技术的飞速发展,文本转语音(TTS)领域迎来了新的里程碑。2025年6月5日,ElevenLabs正式推出其最新文本转语音模型 Eleven v3(Alpha版),被誉为“地表最强”的TTS模型。这款模型不仅能将文本转化为自然流畅的语音,还能通过精准的情感控制和多语言支持,模拟真实对话中的语气变化与非语言表达,为创作者和开发者提供了前所未有的语音生成体验。以下是AIbase对Eleve

Qwen-TTS重磅发布:方言语音合成新突破,真实感媲美真人

昨日,阿里巴巴通义团队正式推出了Qwen-TTS模型,这款文本转语音(TTS)模型以其超高真实感和多方言支持引发行业热议。AIbase编辑团队整理最新信息,为您深入解析这款通过Qwen API提供服务的语音合成利器,及其在AI语音技术领域的突破性意义。Qwen-TTS:超真实语音合成Qwen-TTS是通义团队基于大规模语音数据集研发的最新文本转语音模型,通过数百万小时的语音训练,生成的声音在自然度

AI语音迎来「特斯拉时刻」,一条工作流「吃掉」全球百亿市场

厨房里的语音助手精准响应指令,虚拟偶像跨七国语言无缝切换直播,短剧出海仅需一次点击即可生成多语种配音……这些曾被行业寄予厚望的AI语音场景,长期受限于技术瓶颈,沦为“实验室里的半成品”。2025 年 3 月,OpenAI正式推出了新一代音频模型:gpt-4o-transcribe (语音转文本)、gpt-4o-mini-transcribe (语音转文本)、gpt-4o-mini-tts(文本

MiniMax Audio推Speech- 02语音模型,一次性可以输入20万字符

备受关注的音频技术创新者MiniMax Audio正式发布了其全新的Speech-02系列语音模型,支持30多种语音,一次性可以输入20万字符。<!-- notionvc: fdae198d-f9e2-4313-bbcb-747cd4c93a10 -->为用户带来更真实、更流畅、更便捷的音频体验。全新的Speech-02系列是本次更新的核心亮点。据官方介绍,该系列在多语言覆盖能力上实现