大模型
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
据虎嗅消息,国内大模型公司DeepSeek的一位核心高管已于半年前悄然离职创业,并计划在2025年圣诞节前后推出其首款Agent产品。有接近人士向虎嗅透露,该高管曾担任DeepSeek的“CTO”角色,不过也有知情人指出,DeepSeek内部架构中并无明确设置“CTO”职位。该职位在名义上可能并不存在,但确有高管承担类似的技术统筹与研发决策职责。另据可靠消息,这一创业项目目前已获得某头部VC的融资
「6月27日AI日报」腾讯开源轻量级混元-A13B模型;可灵AI推“视频音效”功能
欢迎来到AIbase【AI日报】栏目!每天三分钟了解当日AI大事件,助你洞悉AI行业趋势、创新AI产品应用。更多AI资讯访问:https://www.aibase.com/zh1、腾讯开源轻量级混元-A13B模型1张中低端GPU卡即可部署腾讯发布混元大模型家族的新成员混元-A13B模型,采用专家混合(MoE)架构,总参数规模达800亿,激活参数为130亿,大幅降低推理延迟与计算开销,为个人开发
字节跳动启动 “Top Seed” 计划,面向 2026 届博士生招募 AI 人才
字节跳动近日宣布正式启动2026届 “Top Seed” 大模型顶尖人才校招计划,计划招募约30位优秀博士生。这一项目专注于前沿的人工智能领域,涵盖大语言模型、机器学习算法与系统、多模态生成与理解、语音处理等研究方向。字节跳动希望通过此举,吸引那些在大模型研究领域具备极强潜力和热情的年轻才俊。与以往的招聘计划不同,本届 “Top Seed” 强调 “不限专业背景”,更加关注应聘者的研究潜力与热情。
Llama 4大模型跌落神坛:作弊刷榜、代码能力极差、和DeepSeek比就是伪开源
4月8日消息,被寄予厚望的美国Meta公司的最新开源大模型Llama 4发布不到2天时间,口碑急转直下,被质疑为刷榜作弊实际效果差、开源条件多部署门槛高是伪开源等。今天,大模型评测平台LM Arena亲自下场发文,打脸Meta提供给平台的Llama 4是“特供版”。据知情人士爆料称,Meta因面临DeepSeek、Gemini等竞品的快速迭代压力,选择“仓促发布未完成优化的模型”,牺牲技术严谨
字节跳动火山方舟正式接入DeepSeek-R1-0528版本
近日,火山引擎旗下的大模型服务平台火山方舟正式宣布接入最新版本的DeepSeek-R1-0528,此举不仅彰显了火山引擎在大模型服务领域的技术实力,也为企业用户和开发者提供了更为高效、便捷的大模型应用体验。火山方舟平台针对大模型应用的核心需求,即速度和稳定性,构建了高性能服务体系。通过自研的xLLM高性能推理框架,该平台实现了模型延迟低至30ms Per Token的极致推理速度,并凭借行业领先的