Gemini2.5版本发布原生音频功能,AI 对话更加自然 在最近的开发更新中,谷歌更新了 Gemini2.5版本,标志着 AI 音频对话和生成技术的重大进步。Gemini2.5是一个多模态的 AI 系统,能够原生理解和生成文本、图像、音频、视频和代码,提升了用户与 AI 的互动体验。Gemini2.5的实时音频对话功能使得人机交流变得更加自然。人类的对话往往涉及语调、口音以及非语言的声音(如笑声),这些细节都能通过 Gemini 的音频生成技术得到体现。 AI热点 19小时前 0 点赞 0 评论 165 浏览
百度推出Ernie X1与Ernie 4.5:多模态AI模型、成本优势及行业竞争解析 百度发布Ernie X1与Ernie 4.5 AI模型,Ernie X1以低成本媲美DeepSeek R1,具备自主工具使用能力;Ernie 4.5对标GPT-4,强化多模态与情商特性。面对DeepSeek、腾讯及字节跳动的竞争,百度通过技术升级与开源策略巩固AI领先地位,阿里巴巴则宣布3800亿AI投资计划 AI热点 2月前 2 点赞 0 评论 69 浏览