一张图 + 一句话实现任意角色场景姿势,腾讯混元宣布开源定制化图像生成插件 InstantCharacter

感谢IT之家网友 Alive1 的线索投递!IT之家 4 月 18 日消息,腾讯混元今日宣布开源定制化图像生成插件 InstantCharacter,并实现了对开源文生图模型 Flux 的兼容。腾讯官方介绍称,通过这个插件,在大模型中,只需要一张图加一句话,就可以让任何角色以你想要的姿势出现在任何地方。输入原始图片+ prompt :a  rabbit is in the kitchen ho

中国移动发布移动爱家 AI 拍摄眼镜与 AI 音频眼镜

IT之家 4 月 18 日消息,中国移动智慧家庭运营中心 4 月 15 日在第五届中国国际消费品博览会上发布了全新产品“移动爱家 AI 眼镜”。移动爱家 AI 拍摄眼镜与 AI 音频眼镜通过深度融入大模型,可实现智能体视频通话、跨应用联动、辅助教育、协作办公等功能。移动爱家 AI 眼镜号称配备了“三个技能”:“好耳机”:在音质方面,采用双麦 ENC 通话降噪,经过数千次的音频调试,环境噪声抑制能

年后完成第四轮融资,智谱再获北京人工智能产业投资基金 2 亿追投

感谢IT之家网友 Skyraver 的线索投递!IT之家 4 月 18 日消息,4 月 16 日,北京市人工智能产业投资基金宣布在去年已有投资基础上,继续追加投资智谱(Z.ai)2 亿元人民币,支持智谱的开源模型研发与开源社区生态建设。北京市人工智能产业投资基金表示,智谱是基金成立以来投资的第一家 AI 大模型企业,也是目前成长最快的企业。智谱在包括文本、推理、语音、图像、视频、代码等在内的模

谷歌 Gemini 2.5 Flash 混合推理 AI 模型上线:性能成本双优

IT之家 4 月 18 日消息,谷歌公司昨日(4 月 17 日)发布公告,宣布在 Google AI Studio 和 Vertex AI 中,以 Gemini API 的方式推出 Gemini 2.5 Flash Preview 预览 AI 模型。用户还可通过 Gemini 应用内的模型选择器直接使用,并结合 Canvas 工具优化文档和代码编辑。IT之家此前报道,Gemini 2.5 Fla

METR 实测:OpenAI o3 AI 推理模型有“作弊”倾向以提升分数

IT之家 4 月 18 日消息,风险测试机构“机器智能测试风险”(METR)昨日(4 月 17 日)发布报告,与 OpenAI 合作测试其 o3 模型时发现,该模型展现出更强的“作弊”或“黑客行为”倾向,试图通过操控任务评分系统提升成绩。IT之家援引报告内容,在 HCAST(人类校准自主软件任务)和 RE-Bench 测试套件中,o3 模型约 1% 到 2% 的任务尝试涉及此类行为。这些行为包括

微软 BitNet b1.58 2B4T 登场:内存占用仅 0.4GB,20 亿参数模型颠覆 AI 计算

IT之家 4 月 18 日消息,科技媒体 WinBuzzer 昨日(4 月 17 日)发布博文,报道称微软研究团队推出了一款开源大型语言模型 BitNet b1.58 2B4T,区别于传统训练后量化的方式,这款拥有 20 亿参数的大型语言模型(LLM)以 1.58 位低精度架构原生训练而成。IT之家援引技术报告介绍,该模型性能直追同规模全精度模型,但计算资源需求大幅缩减。尤其令人瞩目的是,其非嵌

599 元 → 388 元:小米 MIJIA 智能音频眼镜悦享版国补再降价

小米 MIJIA 智能音频眼镜・悦享版去年 3 月上市,官方定价 599 元。今日京东直降至 499 元,今晚 20:00 起叠加 200-20 元券(点此领券)与 15% 政府补贴,实付 407 元即可入手。晒单再返 20 元京豆,折合仅需 388 元好价:京东小米 MIJIA 智能音频眼镜悦享版 圆形时尚款多重优惠 388 元直达链接另外小米新款“MIJIA 智能音频眼镜 2”也支持今晚 2

字节 Seed 开源 UI-TARS-1.5:基于视觉-语言模型构建的多模态智能体

IT之家 4 月 18 日消息,IT之家从豆包大模型团队获悉,UI-TARS-1.5 昨日正式发布并开源。这是一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。有关的链接如下:GitHub:https://github.com/bytedance/UI-TARSWebsite:https://seed-tars.com/Arxiv:https://arxiv.org

OpenAI 上线 Flex 处理模式:API 费用减半,但牺牲响应速度及稳定性

IT之家 4 月 18 日消息,据外媒 TechCrunch 今日报道,为在与谷歌等生成式 AI 竞争对手的较量中进一步加大投入,OpenAI 宣布推出“Flex 处理模式”新的 API 服务 —— 用户以接受响应速度变慢和“资源偶尔无法分配”为代价,换取更优惠的模型使用价格。OpenAI 表示,Flex 处理目前已对新近发布的 o3 和 o4-mini 推理模型开放测试,主要面向模型评估、数据

业界首个,阿里通义万相“首尾帧生视频模型”开源

IT之家 4 月 17 日消息,阿里通义万相「首尾帧生视频模型」今日宣布开源,该模型参数量为 14B,号称是业界首个百亿参数规模的开源首尾帧视频模型。它可根据用户指定的开始和结束图片,生成一段能衔接首尾画面的 720p 高清视频,此次升级将能满足用户更可控、更定制化的视频生成需求。用户可在通义万相官网直接免费体验该模型,或在 Github、Hugging Face、魔搭社区下载模型本地部署后进行