DeepSeekR1

DeepSeek更新R1推理AI模型,已发布Hugging Face

DeepSeek 已在开发者平台 Hugging Face 上发布他们 R1 推理 AI 模型的更新版本,这一消息最初是在周三早上通过其微信公众号宣布的。根据 DeepSeek 的公告,这一更新版本的 R1 采用了非常宽松的 MIT 许可证,可用于商业用途,但此次更新仅为“小幅升级”。Hugging Face 上的模型库中没有详细描述,仅包含配置文件和权重(即模型运行的核心参数)。更新后的 R

清华与上海 AI Lab 联合打造新型过程奖励模型GenPRM,让小模型超越 GPT-4o

在人工智能领域,随着 OpenAI 的 o1和 DeepSeek 的 R1模型受到广泛关注,大语言模型(LLM)的推理能力和测试时扩展(TTS)技术引发了众多研究者的兴趣。然而,在处理复杂推理问题时,如何准确评估模型每一步的回答质量,依然是一个亟待解决的难题。为此,清华大学与上海 AI Lab 共同提出了生成式过程奖励模型(GenPRM),为过程监督推理提供了创新解决方案。传统的过程奖励模型(PR

快手搜索AI升级:DeepSeek R1全面接入,搜索体验迎来质变!

快手宣布,其搜索功能已全面接入DeepSeek R1大模型能力,此举旨在显著提升搜索效果和用户体验,并进一步推动用户活跃度的增长。同时,快手也着眼于未来,积极探索智能搜索场景的商业化变现潜力。此前,快手的AI内容创作平台“可灵AI”已率先整合DeepSeek R1。在视频和图片生成领域,用户现在可以借助DeepSeek的强大能力,更高效地生成或优化提示词,从而简化创作流程。特别是在文生视频场景中,

斯坦福最新评测:DeepSeek R1医疗AI模型超越Google和OpenAI,赢得高分

近日,斯坦福大学发布了一项有关临床医疗 AI 模型的全面评测,DeepSeek R1以66% 的胜率和0.75的宏观平均分,在九个前沿大模型中脱颖而出,成为冠军。这一评测的亮点在于,它不仅关注传统医疗执照考试题,更深入到临床医生的日常工作场景,给出了更切实的评估。评测团队构建了一个名为 MedHELM 的综合评估框架,包含35个基准测试,覆盖22个医疗任务子类别。这个框架的设计经过了29名来自14