AI热点 3小时前 80 阅读 0 评论

NTT 推出日语优化 AI 模型 tsuzumi2:30B 参数,40GB 单卡可运行

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

IT之家 10 月 21 日消息,日本 NTT 当地时间 20 日宣布推出新款日语环境优化轻量级 AI 模型 tsuzumi2。这款 30B 参数模型在推理运行时仅需约 30GB 内存,一张 A100 40GB 即可满足要求,能方便地在本地或私有云环境部署,保障机密信息安全性。

NTT 在 2023 年发布了同样定位的初代 tsuzumi 模型,此次 tsuzumi2 的诞生源于政企组织在实际使用初代 tsuzumi 后对复杂文档理解能力与专业知识应对能力等方面提出的要求。

NTT 宣称,tsuzumi2 在日语环境中拥有同等参数规模模型中一流的性能;而通过 RAG(IT之家注:检索增强生成)和微调,tsuzumi2 在金融、医疗、公共领域能发挥出更优秀的表现,对 NTT 自身业务而言甚至优于 GPT-5

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!