腾讯元宝已支持多达36种文件格式的解析与处理

3月28日,腾讯元宝宣布了一项重大更新,其AI助手现在能够支持多达36种文件格式的解析与处理。这一更新进一步拓展了元宝在工作和学习场景中的应用能力,为用户提供了更加便捷和高效的服务。元宝作为腾讯推出的AI助手,一直以来都致力于通过强大的模型能力帮助用户提升效率。此次更新后,用户可以直接上传包括Word、PDF、Excel在内的常见文档格式,以及.py、.java、.json等开发文件。元宝不仅能够

MIT 与哈佛联合推出 Lyra:一种高效的生物序列建模新方法

在生物序列建模领域,深度学习技术的进步令人瞩目,但高昂的计算需求和对大数据集的依赖让许多研究者感到困扰。最近,麻省理工学院(MIT)、哈佛大学和卡内基梅隆大学的研究团队推出了一种名为 Lyra 的新型生物序列建模方法。这种方法不仅参数显著减少到仅有传统模型的12万分之一,而且能够在短短两小时内使用两块 GPU 进行训练,极大地提升了模型的效率。Lyra 的设计灵感来源于生物学中的上位效应(即序列内

英伟达计划收购贾扬清创办的AI初创公司Lepton AI 推动云计算布局

根据外媒《信息》的报道,英伟达即将收购知名 AI 创业公司 Lepton AI,交易金额预计在数亿美元。这一举措标志着英伟达正积极进军云计算和企业软件市场,力图与亚马逊、谷歌等主要云服务商展开竞争。Lepton AI 成立于两年前,由著名科学家贾扬清及其团队创立。该公司专注于为 AI 时代构建新型基础设施,致力于简化 AI 模型的构建与部署。与许多创业公司不同,Lepton AI 并不直接训练大型

Manus正式推出付费计划,Manus Starter套餐定价39美元/月

在人工智能服务日益竞争的背景下,Manus近日宣布推出其首个付费订阅模式,标志着该平台从免费测试阶段向商业化运营的重要转型。公司推出了两个不同级别的订阅计划:Starter和Pro,同时保留了1,000积分的免费额度,为不同需求的用户提供了灵活选择。Manus Starter套餐定价39美元/月,提供3,900月度积分,允许同时运行两个任务,并赋予用户专属资源、扩展上下文长度以及高峰时段优先访问的

​首个AI心理健康聊天机器人 Therabot 试验显示显著疗效

在现代社会中,心理健康问题日益受到关注,越来越多的人开始求科技的帮助。达特茅斯学院的研究人员最近开展了一项关于 AI 心理健康聊天机器人 Therabot 的试验,旨在评估其在改善心理健康方面的有效性。此次研究涉及106名被诊断为重度抑郁症、广泛性焦虑症和饮食失调症的参与者,试验为期四周。图源备注:图片由AI生成,图片授权服务商MidjourneyTherabot 与其他聊天机器人如 ChatGP

Figure AI突破人形机器人行走技术:速度接近人类,训练仅需数小时

近日,Figure AI公司公布了其人形机器人行走技术的最新进展,展示了通过强化学习训练出的自然行走能力。这一技术不仅大幅提升了机器人的移动速度,还标志着AI驱动的机器人控制系统迈向全新高度。据悉,新一代机器人Figure02的行走速度已达到每小时2.68英里(约1.2米/秒),接近人类正常步行速度(约3-4英里/小时),相比前代Figure01的0.67英里/小时提升了近七倍。

零成本拍爆款!AI电商视频生成神器Product Anyshoot来了 转化率飙升300%

随着电子商务的迅猛发展,如何高效、真实地展示商品成为商家面临的重要课题。近日,一款名为Product Anyshoot的AI视频生成工具引发行业关注。这款工具凭借其独特的功能和出色的商品还原能力,被誉为“电商视频生成神器”,有望彻底改变传统商品展示视频的制作方式。据介绍,Product Anyshoot的核心优势在于其强大的商品“传送”能力。商家只需上传一张商品图片,系统便能智能识别并将该商品无缝

Ideogram 正式发布 3.0 版本模型:真实感与创意表现再突破

Ideogram 官方宣布推出其最新图像生成模型——Ideogram3.0。这一版本在真实感、创意表现力和风格一致性上实现了显著突破,被认为是图像生成领域的一次重要里程碑。新模型不仅对标 GPT-4o 等顶级AI 系统,还以其高效性能和创新功能吸引了广泛关注。Ideogram3. 0 在文本渲染能力上取得了质的飞跃。相较于市场上大多数图像生成模型,该版本能够生成清晰可读、风格统一的艺术

阿里云通义千问发布新一代端到端多模态旗舰模型 Qwen2.5-Omni 并开源,看听说写样样精通

感谢IT之家网友 _Ikaros_、乌蝇哥的左手 的线索投递!IT之家 3 月 27 日消息,今日凌晨,阿里云发布通义千问 Qwen 模型家族中新一代端到端多模态旗舰模型 ——Qwen2.5-Omni,并在 Hugging Face、ModelScope、DashScope 和 GitHub 上开源。阿里云表示,该模型专为全方位多模态感知设计,能够无缝处理文本、图像、音频和视频等多种输入形式,