微软全新开源模型 MAI-DS-R1：敏感话题响应提升，安全风险降低

AIbase基地

AI技术专栏作家 | 发布了 246 篇文章

微软在其官网上正式开源了 DeepSeek-R1的魔改版 ——MAI-DS-R1。这一新模型在保留原有推理性能的基础上，进行了显著的增强，尤其在对敏感话题的响应能力上取得了巨大的突破。

MAI-DS-R1的响应能力达到了99.3%，是原版 R1的两倍多。这一进步将对政治学、社会问题以及伦理道德的研究提供极大的支持。尽管其响应了更多的敏感话题，但在安全风险方面，MAI-DS-R1的有害内容降低了50%，展现出良好的安全控制能力。因此，渴望体验 “放飞自我” 版的用户可以尝试这一模型，探索新的可能性。

在模型的训练过程中，微软收集了约350，000个被屏蔽的主题示例，并筛选出相关的查询关键词。这些关键词被转化为多个问题并翻译成不同语言，进一步提升了模型的多语言适应性。此外，微软利用 DeepSeek R1及内部模型生成了相关问题的答案和思维链。训练数据还包括来自 Tulu3SFT 数据集的110，000个安全和违规示例，确保了模型在多种情况下的有效性。

经过全面评估，MAI-DS-R1在敏感话题的响应能力上表现出色，远超 DeepSeek R1及其衍生版本。在安全性评估中，MAI-DS-R1在 HarmBench 测试中表现不俗，显示出能够有效减少有害内容的能力，确保安全性和响应能力之间的良好平衡。

在推理能力方面，MAI-DS-R1与 DeepSeek R1保持一致，在常识、推理、数学和编程的基准测试中均表现优异。与此同时，该模型在处理不合法或不道德的请求时更加谨慎，拒绝生成任何有害或不当内容。

此外，MAI-DS-R1在后续的训练过程中将问题翻译成多种语言，使其能更好地满足国际组织、跨国企业及教育机构等多语言需求的场景。微软已在 huggingface 开源了该模型，并在 Azure AI Foundry 进行了发布，为广大用户提供了更多的选择。

huggingface:https://huggingface.co/microsoft/MAI-DS-R1

Azure地址:https://ai.azure.com/explore/models/MAI-DS-R1/version/1/registry/azureml