AI热点 3月前 118 阅读 0 评论

能理解海豚声音!谷歌开发全新AI模型DolphinGemma

作者头像
快科技

AI技术专栏作家 | 发布了 246 篇文章

快科技4月15日消息,谷歌公布了一款名为DolphinGemma”的大型语言模型,旨在帮助科学家理解海豚的声音,并生成类似海豚的声音序列。

研究人员预计在未来几个月内测试DolphinGemma及其配套的Cetacean Hearing Augmentation Telemetry(CHAT)发声系统,以探索是否能够翻译并模仿海豚的声音,进而实现与海豚的某种对话”。

海豚是地球上最聪明且最善于沟通的动物之一,其社交互动极其复杂,不仅能通过各种声响辨识不同的个体,还能在不同活动中发出不同的声音。

科学家们长期以来一直试图破解”这些声音的含义,并尝试模拟海豚的声音与它们沟通。

为此,谷歌与野生海豚计划”(WDP)组织以及美国乔治亚理工学院合作,利用WDP收集的大量海豚哨声、喀嗒声和脉冲声数据,训练了DolphinGemma这一AI模型。

DolphinGemma基于与谷歌Gemini系统相同的技术构建,拥有约4亿个参数,其运作方式与ChatGPT等生成式语言模型类似,但生成的是海豚声音而非文字。

目前的研究方向是让DolphinGemma在听完海豚声音的前半部分”后,由AI生成后半部分”,并比对AI生成的后半部分与海豚实际发出的后半部分是否一致,以初步判断海豚语”是否有固定的单词或结构。

研究计划初期定位在将海豚喜欢的物体与特定的合成声”相关联,期望海豚在想要这些物体时能发出对应的合成音,达成初步沟通。

但DolphinGemma究竟能达到什么程度,以及是否能让海豚与人类真正对话,目前仍是一个遥远的课题。

(举报)

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!