大模型
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
据虎嗅消息,国内大模型公司DeepSeek的一位核心高管已于半年前悄然离职创业,并计划在2025年圣诞节前后推出其首款Agent产品。有接近人士向虎嗅透露,该高管曾担任DeepSeek的“CTO”角色,不过也有知情人指出,DeepSeek内部架构中并无明确设置“CTO”职位。该职位在名义上可能并不存在,但确有高管承担类似的技术统筹与研发决策职责。另据可靠消息,这一创业项目目前已获得某头部VC的融资
学术打假!清华上交大研究颠覆认知:强化学习竟是大模型推理的"绊脚石"
【研究颠覆】清华大学与上海交通大学联合发表的最新论文,对业界普遍认为"纯强化学习(RL)能提升大模型推理能力"的观点提出了挑战性反驳。研究发现,引入强化学习的模型在某些任务中的表现,反而逊色于未使用强化学习的原始模型。【实验验证】研究团队在数学、编码和视觉推理三大领域进行了系统性实验:数学任务:在GSM8K、MATH500等基准测试中,RL模型在低采样次数(k值)下准确率提升,但在高k值时问题覆盖
开源新模型 DeepCoder:超高效编程,超越OpenAI o1模型
在科技发展的浪潮中,人工智能(AI)技术日新月异。最近,由著名大模型训练平台 Together AI 和智能体平台 Agentica 联合开源的新模型 DeepCoder-14B-Preview,吸引了广泛关注。该模型以仅有的140亿参数,在代码测试平台 LiveCodeBench 上的得分为60.6%,超过了 OpenAI 的 o1模型(59.5%),仅略低于 o3-mini(60.9%)。这一