开源项目 1天前 201 阅读 0 评论

谷歌 DeepMind 开源了 Aeneas,一个用于分析古代文本的 AI 模型

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

谷歌DeepMind开源了Aeneas,这是一个用于理解古代铭文的生成式 AI 模型。Aeneas 能够处理文本和图像输入,并在修复受损铭文中缺失字符方面超越了其他最先进的模型。

 

Aeneas 旨在帮助历史学家进行碑文研究,即研究古代铭文。它有助于自动化几个关键任务:确定铭文的年代;识别铭文的起源地区;重建部分铭文;以及识别相似铭文,即具有相似词汇或措辞的铭文。Aeneas 使用多模态 transformer 架构作为其核心,每个任务都有专门的头部。在几个碑文任务的评估中,Aeneas 超越了最先进的 AI 模型和人类历史学家。当人类历史学家使用 Aeneas 作为这些相同任务的工具时,综合表现甚至更好。根据 DeepMind 的说法,

 

我们的模型也可以适应其他古代语言、文字和媒介,从纸莎草纸到硬币,扩展了其能力,以帮助在更广泛的历史证据中建立联系……这项工作是探索生成性 AI 如何帮助历史学家更好地识别和解释大规模相似之处的更广泛努力的一部分。我们希望这项研究能够惠及尽可能多的人,因此我们正在为研究人员、学生、教育工作者、博物馆专业人士等提供免费的 Aeneas 互动版本……

 

Aeneas 基于 DeepMind 的Ithaca项目构建,Ithaca 是一个纯文本模型,训练用于对古希腊文本进行碑文研究。Aeneas 增加了对图像输入的支持。Aeneas 还可以恢复未知数量缺失字符的铭文以及输出相似之处,这些是 Ithaca 所缺乏的。

 

为了训练模型,DeepMind 组装了拉丁铭文数据集(LED),一个包含 176,861 个铭文的语料库。他们从现有的源数据集开始,然后创建了一个“复杂的流程”来清理记录,并将它们合并为单一格式。这些数据包含从公元前 7 世纪到公元 8 世纪的铭文,来自从英国到美索不达米亚到罗马世界的各个地区。

 

为了评估其作为研究工具的有效性,DeepMind 与 23 位碑文专家开展了一项研究,这些专家在有时间限制的情况下使用 Aeneas“模拟现实世界的研究工作流程”。人类专家手动选择了相似的铭文,但通常也会至少包含一个由 Aeneas 建议的额外选项。一位研究人员声称:

 

Aeneas 检索到的相似之处完全改变了我对历史的关注……如果让我自己找这些文本,可能需要几天时间,而不是 15 分钟。如果我根据这些铭文的解读来进行历史解读,现在我将有几天的时间来撰写和构建研究问题,而不是寻找相似之处。

 

在 Hacker News 上关于Aeneas的讨论中,一位用户写道:

 

对我来说,这些只是基于现有信息的合理推测,因此无论何时使用这个工具,都需要加上免责声明。话虽如此,许多(古代)历史都是基于部分信息的合理推测。即使我们拥有大量可用的文字资料,比如西塞罗的作品,我们也必须承认,我们是从某个特定视角来看待这些事件的,而这个视角是由个人偏见和动机决定的。因此,我们试图根据存在一定“数据质量问题”的数据来推断历史上发生的事情。

 

Aeneas的代码可以在 GitHub 上找到。还有一个Aeneas互动演示网站

 

原文链接:

https://www.infoq.com/news/2025/08/google-deepmind-aeneas/

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!