谷歌放大招!LMEval开源评测框架上线,AI模型比拼从此更透明
近日,谷歌正式发布了开源框架 LMEval,旨在为大语言模型(LLM)和多模态模型提供标准化的评测工具。这一框架的推出,不仅简化了跨平台模型性能比较,还支持文本、图像和代码等多领域的评估,展现了谷歌在AI评测领域的最新突破。AIbase为您整理了LMEval的最新动态及其对AI行业的影响。标准化评测:跨平台模型比较更简单LMEval的推出标志着AI模型评测进入了一个新阶段。该框架基于LiteLLM