AI

Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强

过去几年,Transformer虽稳坐AI架构「铁王座」,但其二次方复杂度带来的算力消耗和长序列处理瓶颈,限制了大模型在推理阶段处理长文本。Mamba凭借「线性复杂度」异军突起,非常适合长序列任务,有望成为Transformer架构的替代品,但在处理全局关系上偏弱。Mamba+Transformer混合架构可以将二者的优势互补,实现「效率」和「性能」的双丰收。最近英伟达发布了Nemotron-H

前OpenAI员工挺身而出,指控公司重组违背非营利使命

最近,12名前 OpenAI 员工站出来,支持埃隆・马斯克对公司的诉讼,认为 OpenAI 的重组计划背离了最初的非营利使命。这场诉讼引发了广泛关注,尤其是在人工智能行业日益变化的背景下。根据路透社的报道,这些前员工在法庭文件中表示,他们曾在 OpenAI 担任技术和管理职位,并深信非营利模式对于公司的重要性。回顾他们的任职经历,员工们认为,非营利的监督机制一直是公司讨论的核心。然而,近期投资者施

被低估的ChatGPT新功能,10分钟搞定DeepSeek代码库深度研究

大概5天前,ChatGPT「悄悄」上线了一个新功能,就是Deep Research功能可以直连Github仓库。这个功能刚推出时,第一反应是给程序员用的,但是最近使用后才发现这个功能非常强大——应用场景远比想象的更加广阔。添加图片注释,不超过 140 字(可选)不仅仅是审查代码,或者生成报告,能够连接Github的ChatGPT在重度使用后,效果还是超乎想象的——几乎可以进行任何方向的深度研究。