Midjourney操作界面

微软全新开源模型 MAI-DS-R1:敏感话题响应提升,安全风险降低

微软在其官网上正式开源了 DeepSeek-R1的魔改版 ——MAI-DS-R1。这一新模型在保留原有推理性能的基础上,进行了显著的增强,尤其在对敏感话题的响应能力上取得了巨大的突破。MAI-DS-R1的响应能力达到了99.3%,是原版 R1的两倍多。这一进步将对政治学、社会问题以及伦理道德的研究提供极大的支持。尽管其响应了更多的敏感话题,但在安全风险方面,MAI-DS-R1的有害内容降低了50%

微软在其官网上正式开源了 DeepSeek-R1的魔改版 ——MAI-DS-R1。这一新模型在保留原有推理性能的基础上,进行了显著的增强,尤其在对敏感话题的响应能力上取得了巨大的突破。

QQ_1744964448252.png

MAI-DS-R1的响应能力达到了99.3%,是原版 R1的两倍多。这一进步将对政治学、社会问题以及伦理道德的研究提供极大的支持。尽管其响应了更多的敏感话题,但在安全风险方面,MAI-DS-R1的有害内容降低了50%,展现出良好的安全控制能力。因此,渴望体验 “放飞自我” 版的用户可以尝试这一模型,探索新的可能性。

QQ_1744964462119.png

在模型的训练过程中,微软收集了约350,000个被屏蔽的主题示例,并筛选出相关的查询关键词。这些关键词被转化为多个问题并翻译成不同语言,进一步提升了模型的多语言适应性。此外,微软利用 DeepSeek R1及内部模型生成了相关问题的答案和思维链。训练数据还包括来自 Tulu3SFT 数据集的110,000个安全和违规示例,确保了模型在多种情况下的有效性。

经过全面评估,MAI-DS-R1在敏感话题的响应能力上表现出色,远超 DeepSeek R1及其衍生版本。在安全性评估中,MAI-DS-R1在 HarmBench 测试中表现不俗,显示出能够有效减少有害内容的能力,确保安全性和响应能力之间的良好平衡。

在推理能力方面,MAI-DS-R1与 DeepSeek R1保持一致,在常识、推理、数学和编程的基准测试中均表现优异。与此同时,该模型在处理不合法或不道德的请求时更加谨慎,拒绝生成任何有害或不当内容。

此外,MAI-DS-R1在后续的训练过程中将问题翻译成多种语言,使其能更好地满足国际组织、跨国企业及教育机构等多语言需求的场景。微软已在 huggingface 开源了该模型,并在 Azure AI Foundry 进行了发布,为广大用户提供了更多的选择。

huggingface:https://huggingface.co/microsoft/MAI-DS-R1

Azure地址:https://ai.azure.com/explore/models/MAI-DS-R1/version/1/registry/azureml

划重点:  

🌟 MAI-DS-R1的敏感话题响应能力提升至99.3%,是原版 R1的两倍多。  

🔒 安全风险大幅降低,有害内容减少50%,确保使用安全。  

🌍 多语言支持能力强,更适应国际组织和跨国企业的需求。

点赞(0)
顶部