全球首部AI电影登陆院线:70分钟的长片,AI怎么做?|对话主创

声明:本文来自于微信公众号深响,授权站长之家转载发布。AI用于影视作品生产,早已不是什么新鲜事。Netflix早在2023年就发布了首部AIGC动画短片《犬与少年》;芒果TV的旅行综艺《我们仨》启用AI导演,负责旁白、串场和行程策划;美国导演哈莫尼·科林运用AI和游戏引擎制作的影片《暴力漂1流》入围威尼斯电影节非竞赛单元;上海国际电影节在今年的“SIFF ING青年新锐影像计划”中特地拆分出A

百度推出通用多智能体协作 App 心响,已上线超 200 个任务类型

感谢IT之家网友 F宝、西窗旧事 的线索投递!IT之家 4 月 25 日消息,今日 Create2025 百度 AI 开发者大会在武汉举行,会上百度正式推出一款通用多智能体协作 App 心响。目前产品已上线安卓版,iOS 正在上架中。目前,心响 App 已上线了包括例行任务、城市旅游、AI 相亲、深度研究、法律咨询、健康咨询、智慧图表、试题讲解、AI 绘本、游戏开发在内的十大场景超 200 个

Tavus发布SOTA唇形同步模型Hummingbird-0:革新零样本唇形同步技术

近日,AI视频研究公司Tavus正式发布了其最新零样本唇形同步模型Hummingbird-0,被誉为当前最先进的唇形同步技术(State-of-the-Art, SOTA)。该模型已在Tavus平台、API以及FAL上开放研究预览,引发了AI内容创作领域的广泛关注。零样本唇形同步的突破性进展Hummingbird-0是Tavus基于其旗舰模型Phoenix-3组件开发的全新唇形同步模型。该模型的最

Secretary自媒体神器发布,自动化社交媒体分析赋能多场景应用

一款名为Secretary的AI驱动自媒体工具正式亮相,专注于自动化跟踪与分析社交媒体内容,并将结果以Markdown格式推送至微信平台。据AIbase了解,Secretary支持Truth Social和Twitter(现为X)两大平台,允许用户为不同账号设置定制化分析主题(如财经、政治、科技),并实现多团队定向推送。该工具的发布在开发者与企业用户中引发广泛关注,已通过GitHub开源。核心功能

利用AI助力办公,英国员工每年可节省122小时!

近日,谷歌发布了一项新报告,指出如果能有效培训员工使用人工智能(AI),英国经济可能从 AI 驱动的增长中获益4000亿英镑(约合5330亿美元)。这项报告基于一项在英国进行的试点计划,结果显示,员工在行政工作中通过使用 AI 工具平均每年能够节省超过122小时的时间。报告强调,简化 AI 的使用步骤和提供适当的培训是提升 AI 普及率的关键。谷歌的欧洲、中东和非洲地区总裁黛比・温斯坦(Debbi

百度发布文心大模型 4.5 Turbo 与 X1 Turbo:降价提速,强力进化

在4月25日举行的百度 Create 开发者大会上,百度创始人李彦宏隆重发布了最新的文心大模型系列 —— 文心4.5Turbo 和 X1Turbo。这两款新模型在速度和成本方面都进行了显著优化,标志着百度在人工智能领域的进一步突破。据悉,文心4.5Turbo 相比于之前的版本,其速度提升显著,处理效率更高,同时价格下降了整整80%。具体来看,每百万个 token 的输入费用仅为0.8元,而输出费用

Meta 发布 WebSSL 模型:无语言视觉学习的新探索

在人工智能领域,Meta 公司最近推出了 WebSSL 系列模型,这一系列模型的参数规模从3亿到70亿不等,基于纯图像数据进行训练,旨在探索无语言监督的视觉自监督学习(SSL)的巨大潜力。这一新研究为未来的多模态任务带来了新的可能性,也为我们理解视觉表征的学习方式提供了新的视角。过去,OpenAI 的 CLIP 模型因其在视觉问答(VQA)和文档理解等多模态任务中的优异表现而备受关注。然而,由于数

Eagle 2.5 – 英伟达推出的视觉语言模型

Eagle 2.5是什么Eagle 2.5是英伟达推出的视觉语言模型,专注于长上下文多模态学习的 AI 模型,参数规模仅为 8B。参数量较小,但在处理高分辨率图像和长视频序列方面表现出色,性能媲美参数量更大的 Qwen 2.5-VL-72B 和 InternVL2.5-78B。Eagle 2.5 采用创新训练策略:信息优先采样和渐进式后训练。信息优先采样通过图像区域保留和自动降级采样技术,确保

DAM-3B – 英伟达推出的多模态大语言模型

DAM-3B是什么DAM-3B(Describe Anything 3B)是英伟达推出的多模态大语言模型,专为生成图像和视频中特定区域的详细描述设计。模型通过点、边界框、涂鸦或掩码等方式指定目标区域,能生成精准且符合上下文的描述文本。 DAM-3B的核心创新包括“焦点提示”技术和“局部视觉骨干网络”。焦点提示技术将全图信息与目标区域的高分辨率裁剪图融合,确保细节不失真,同时保留整体背景。局部视

Anthropic 示警:Claude 等 AI 被滥用,引导舆论威胁公众认知

IT之家 4 月 24 日消息,Anthropic 昨日(4 月 23 日)发布博文,报告称 Claude 等前沿 AI 模型正被恶意行为者滥用,涉及“舆论引导服务”(influence-as-a-service)操作、凭证填充、招聘诈骗及恶意软件开发等活动。Anthropic 开发团队为 Claude 采取了多项安全措施,成功阻止了许多有害输出,但威胁行为者仍在尝试绕过这些保护。IT之家援引博