上海人工智能实验室推出升级版多模态大模型 “书生・万象 3.0”

在人工智能迅速发展的今天,上海人工智能实验室再次引领潮流,推出了全新的多模态大模型 “书生・万象3.0”。这一升级版本不仅在技术上进行了全面提升,还在多模态预训练和后训练方法的加持下,展现出了更强大的基础能力和应用潜力。“书生・万象3.0” 具备同时处理文本和多种多模态输入的能力,这使得它在多个应用场景中都能表现出色。例如,在 GUI 智能体、建筑图纸理解和空间推理等方面,该模型的表现都相当领先。

404-GEN成为首个与Unity集成的去中心化3D模型生成平台,推动内容创作的民主化

瑞士初创公司404-GEN宣布,它已成为首个与Unity集成的去中心化3D模型生成平台。这一突破性的整合使得开发者和玩家能够在Unity环境中直接从Bittensor主网生成3D模型,标志着去中心化内容创作的新时代。404-GEN的AI模型通过创新的高斯溅射(Gaussian Splats)技术,为Unity用户带来了分散式的内容创作体验。与传统3D建模方式不同,高斯点云技术能通过扫描区域生成点云

豆包深度思考和文生图3.0模型正式开放API 对企业客户开放

豆包大模型近日发布了系列更新,其中豆包1.5·深度思考模型和豆包文生图模型3.0正式通过火山引擎开放 API,供开发者和企业客户使用。这两款模型在推理任务和通用任务的综合表现达到了业界前沿水平,并在视觉推理和图像生成方面取得了显著进展。豆包1.5·深度思考模型在专业领域推理任务中表现出色,数学推理 AIME2024测试得分追平 OpenAI o3-mini-high,编程竞赛 Codeforces

中国航天科技集团:固体动力人工智能大模型平台完成升级并上线运行

感谢IT之家网友 Autumn_Dream 的线索投递!IT之家 4 月 16 日消息,据中国航天科技集团消息,近日,中国航天科技集团有限公司四院固体动力 AI(人工智能)大模型平台完成 DeepSeek 融合升级,平台功能和性能全面提升并正式上线运行。据介绍,在本次升级中,固体动力 AI 大模型应用平台通过深度集成 DeepSeek 大模型,不仅迭代优化了上下文理解能力、数学公式格式化输出、

OpenAI 预告凌晨直播,满血版 o3 推理模型有望登场

感谢IT之家网友 GreatMOLA 的线索投递!IT之家 4 月 16 日消息,OpenAI 今日晚间 10 点发布预告,将在 o3 小时后进行直播。从官方特别用词来看,预计将发布满血版 o3 推理模型,时间为凌晨 1 点。OpenAI CEO 奥尔特曼本月初在社交平台 X 上发文称,可能在数周内发布 o3 和 o4-mini,未来几月内发布 GPT-5。o3 技术在 2024 年 12 月

微信首个 AI 助手上线:可与“元宝”在聊天框对话,还能添加好友

感谢IT之家网友 風見暉一、MagicKong、imlufeng 的线索投递!IT之家 4 月 16 日消息,微信首个 AI 助手今日悄悄上线,用户在微信搜索“元宝”,即可找到“聊天”入口。IT之家测试,微信用户可以在聊天对话框中,与元宝进行实时交流,输入对话内容后,元宝甚至会提示“对方正在输入...”,就像真人聊天那样。此外,用户可以将元宝添加到通讯录,就可以在聊天列表和联系人名单中看到元宝

上海人工智能实验室开源多模态大模型“书生・万象 3.0”:能同时处理文本和多模态输入

IT之家 4 月 17 日消息,据上海人工智能实验室官方公众号,4 月 16 日,上海人工智能实验室(上海 AI 实验室)升级并开源了通用多模态大模型书生・万象 3.0(InternVL3)。官方介绍,通过采用创新的多模态预训练和后训练方法,InternVL3 多模态基础能力全面提升,在专家级基准测试、多模态性能全面测试中,10 亿~780 亿参数的全量级版本在开源模型中性能均位列第一,同时大幅

字节跳动发布豆包 1.5 深度思考模型,具备“看图思考”能力

IT之家 4 月 17 日消息,在今日火山引擎 AI 创新巡展杭州站现场,字节跳动旗下火山引擎总裁谭待发布了最新的豆包 1.5・深度思考模型。据介绍,该模型在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出。数学推理 AIME 2024 测试得分追平 OpenAI o3-mini-high,编程竞赛和科学推理测试成绩也接近 o1。在创意写作、人文知识问答等通用任务上,模型也展示出优秀

微软 Edge 浏览器免费上线 Copilot Vision 功能,AI 助手可实时解读屏幕内容

IT之家 4 月 17 日消息,微软人工智能首席执行官穆斯塔法・苏莱曼今天在 Bluesky 上宣布,微软的人工智能助手功能“Copilot Vision”现在可以在 Edge 浏览器中免费使用,该功能可以解读屏幕上的内容并帮助用户使用应用程序。据IT之家了解,“Copilot Vision”是一种“基于语音的体验”,用户可以通过语音指令与之交互。苏莱曼表示,当用户启用该功能时,“Copilot

5000 亿美元大项目版图扩张,消息称 OpenAI、软银考虑在英投资“星际之门”

IT之家 4 月 17 日消息,据英国《金融时报》今日报道,OpenAI 与软银主导的 5000 亿美元(IT之家注:现汇率约合 3.65 万亿元人民币)美国数据中心项目“星际之门”正在考虑未来在英国的投资,旨在全球范围内建立支撑 AI 强大模型所需的基础设施。根据三位接近该项目的知情人士透露,英国已成为其优先选择之一,与英国政府近期通过加大对 AI 行业投资的力度有关,尤其是为开发者提供更便捷