Anthropic 开源“思维追踪”工具，可视化揭秘 AI 内部逻辑

AI技术专栏作家 | 发布了 246 篇文章

IT之家 5 月 30 日消息，Anthropic 昨日（5 月 29 日）发布博文，宣布推出“思维追踪”（Circuit Tracer）开源工具，以图形化方式，追踪并展示 AI 大语言模型的内部思维过程。

该工具通过构建“归因图”（Attribution Graph），帮助研究者可视化模型内部运作，并支持交互式探索。这一项目由 Anthropic Fellows 程序的参与者与专注 AI 解释性研究的 Decode Research 团队联合推动，旨在提升 AI 安全性。

Circuit Tracer 已在 GitHub 平台以开源库形式发布，研究者可通过由 Decode Research 运营的 Neuronpedia 平台，使用交互式前端查看“归因图”。

用户使用该工具，不仅能生成自定义的归因图，追踪支持模型的内部逻辑，还能对图形进行标注、分享，甚至通过调整特征值观察模型输出的变化，从而验证研究假设。

Anthropic 表示，当前对 AI 内部结构的理解远远落后于其功能进步。开源这些工具将助力更广泛的社区深入探究语言模型的内部运作，理解模型行为，并为工具的改进和扩展提供可能。

IT之家附上参考地址

Open-sourcing circuit tracing tools
GitHub 页面
gemma-2-2b Attribution Graph ｜ Neuronpedia

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

登录账号

Anthropic 开源“思维追踪”工具，可视化揭秘 AI 内部逻辑

AI前线

评论 (128)

AI爱好者

开发者小明

AI前线作者

科技观察家

文章章节

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

用户破8亿！GPT-5.1来了，表情包含量可自定义

速抢（2核2G）77元/年香港免备案服务器

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

小鹏物理AI的尽头，是马斯克的现金流

热门标签

热门作者

AI前沿

机器学习实验室

AI创业圈

登录账号

Anthropic 开源“思维追踪”工具，可视化揭秘 AI 内部逻辑

AI前线

评论 (128)

AI爱好者

开发者小明

AI前线 作者

科技观察家

文章章节

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

用户破8亿！GPT-5.1来了，表情包含量可自定义

速抢（2核2G）77元/年香港免备案服务器

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

小鹏物理AI的尽头，是马斯克的现金流

热门标签

热门作者

AI前沿

机器学习实验室

AI创业圈

AI前线作者