大模型训练

AI味道太浓?新型教培正在解决这件事

声明:本文来自于微信公众号 新莓daybreak,作者:路雨晴,授权站长之家转载发布。大模型还在努力提高智商,模拟考题中拿高分,以此证明具备足够的智力解决人类抛出的问题。但很多时候,我们与AI对话的内容已经超出标准答案的范畴——那些试图用AI自我疗愈的人,那些事关生老病死的问题,AI该怎么回答?即便不涉及这些情绪和价值观的问题,对大模型「AI味儿太浓,机器感太重」的吐槽声也不绝于耳。用一位AI

谷歌新研究:合成数据助力大模型,数学推理能力提升八倍

近期,谷歌、卡内基梅隆大学与 MultiOn 的研究团队联合发布了一项关于合成数据在大模型训练中应用的新研究。根据 AI 发展科研机构 Epoch AI 的报告,目前人类公开的高质量文本训练数据大约有300万亿 tokens,但随着大型模型如 ChatGPT 的快速发展,对训练数据的需求正以指数级增长,预计在2026年前这些数据将被消耗殆尽,因此合成数据逐渐成为重要的替代方案。研究人员探索了合成数

一听到「AI to B」的叫卖声,1688就再也坐不住了

声明:本文来自于微信公众号 新莓daybreak,作者:翟文婷,授权站长之家转载发布。AI正在肉眼可见地泛化与下沉:有问必答,能陪聊,还是打工人给自己找的一个免费助理。见此情形,B 端商家有点急了。大模型如此全能,AI对一门生意的理解和经营,是不是也应该发挥点作用?只是跟C 端用户的拿来主义不同,AI提高B 端生产力的前提是懂这门生意,甚至可能需要进一步精调训练大模型。虽然「AI to B」好