Meta 发布 ReasonIR-8B：破解 AI 复杂推理检索难题，刷新 BRIGHT 纪录

AI技术专栏作家 | 发布了 246 篇文章

IT之家 5 月 1 日消息，科技媒体 marktechpost 昨日（4 月 30 日）发布博文，报道称 Meta AI 推出 ReasonIR-8B 模型，专为推理密集型检索设计，不仅在检索精度上取得突破，其低成本和高效率也使其成为实际应用的理想选择。

当前检索增强生成（RAG）系统在处理复杂推理任务时，常常因检索器性能不足而受限。传统检索器多针对简短事实性问题训练，擅长文档级别的词语或语义匹配，但面对长篇或跨领域查询时，难以整合分散知识，这种缺陷会导致错误信息传递，影响后续推理效果。

Meta AI 推出的 ReasonIR-8B 模型直击这一痛点，基于 LLaMA3.1-8B 训练，结合创新数据生成工具 ReasonIR-SYNTHESIZER，构建模拟真实推理挑战的合成查询和文档对，更精准支持复杂任务。

ReasonIR-8B 采用双编码器（bi-encoder）架构，将查询和文档独立编码为嵌入向量，通过余弦相似度评分。其训练数据包括长达 2000 个 token 的多样长度查询（VL Queries）和需逻辑推理的困难查询（HQ），有效提升模型处理长上下文和抽象问题的能力。

在 BRIGHT 基准测试中，该模型原查询得分达 24.4 nDCG@10，结合 Qwen2.5 重新排序后提升至 36.9，远超更大的 Rank1-32B 模型，且计算成本低至后者的 1/200。此外，在 MMLU 和 GPQA 等 RAG 任务中，模型分别带来 6.4% 和 22.6% 的显著提升。