AI新词

AI训练新方式!Anthropic 斥巨资 “拆书” 换数据,法律之争引热议

近日,人工智能公司 Anthropic 以数百万美元的巨额投入,购买并 “拆解” 大量图书,用于训练其 AI 助手 Claude。这一举动引发了公众的广泛关注和法律界的热议。根据外媒 Ars Technica 报道,Anthropic 为了获取训练数据,采取了一种颇具争议的方法。他们将大量实体书籍拆解、扫描成数字文件,然后直接销毁原件。这一做法在法庭文件中被披露,法官 William Alsup

英伟达与MIT合作推出 Fast-dLLM 框架,AI 推理速度提升 27.6 倍

近日,科技巨头英伟达联合麻省理工学院(MIT)与香港大学,发布了名为 Fast-dLLM 的新框架。这一创新的框架旨在显著提高扩散模型(Diffusion-based LLMs)的推理速度,最高可达27.6倍,为人工智能的应用提供了更为强大的技术支持。 扩散模型的挑战与机遇扩散模型被视为传统自回归模型(Autoregressive Models)的有力竞争者。它采用双向注意力机制(Bidirect

重磅!谷歌开源Gemma3n多模态模型,手机也能跑出云端AI性能

 谷歌于本周五凌晨正式发布并开源全新端侧多模态大模型Gemma3n,这一突破性产品为手机、平板、笔记本等端侧设备带来了此前只能在云端体验的强大多模态功能。核心特性:小体积大能力Gemma3n提供E2B和E4B两个版本,虽然原始参数量分别为5B和8B,但通过架构创新,其内存占用仅相当于传统2B和4B模型,分别只需2GB和3GB内存即可运行。该模型原生支持图像、音频、视频和文本的多模态输入处理,支持1

通义千问正式发布Qwen3-Embedding系列模型

近日,通义千问官方正式发布了Qwen3-Embedding系列模型,作为Qwen模型家族的新成员,该系列模型专为文本表征、检索与排序任务而设计。Qwen3-Embedding系列基于Qwen3基础模型进行训练,充分继承了Qwen3在多语言文本理解能力上的显著优势。该系列模型在多项基准测试中表现出色,特别是在文本表征和排序任务中展现了卓越性能。测试使用了MTEB(包括英文版v2、中文版v1、多语言版

Claude Artifacts重磅上线!零代码打造AI应用,分享创意从此无界

近日,Anthropic宣布其旗舰AI模型Claude推出全新功能——Artifacts创作空间及应用发布分享功能。这一功能允许用户通过简单的对话快速创建、保存和分享AI驱动的应用,并将Claude的智能直接嵌入其中,无需复杂API配置。AIbase为您详细解读这一功能的亮点及其对AI创作生态的深远影响。Artifacts创作空间:从灵感变现实的AI工作台Claude的Artifacts创作空间为

Komiko视频到视频功能炸裂上线!AI一键打造动漫大片,漫画动画创作从未如此简单

Komiko平台宣布推出全新视频到视频(Video-to-Video)功能,进一步巩固其作为AI驱动的漫画、动画和插画一体化创作平台的领先地位。这一功能结合AI线稿上色、背景移除、图像增强和动画补帧技术,让用户仅需几分钟即可创作出专业品质的漫画和动画作品。AIbase为您深度解析Komiko的最新突破及其对创意产业的深远影响。视频到视频功能:一键转换,创意无限Komiko全新推出的视频到视频功能允

通义开源视觉感知多模态RAG推理框架VRAG-RL

近日,通义实验室自然语言智能团队正式发布并开源了VRAG-RL——一款视觉感知驱动的多模态RAG推理框架,旨在解决在真实业务场景中,AI如何从图像、表格、设计稿等视觉语言中检索关键信息并进行精细化推理的难题。在复杂视觉文档知识库中检索并推理关键信息,一直是AI领域的一大挑战。传统的检索增强型生成(RAG)方法在处理视觉丰富信息时显得力不从心,主要因为它们难以应对图像、图表等视觉内容,且现有视觉RA

Black Forest震撼开源FLUX.1 Kontext [dev]:媲美GPT-4o的图像编辑

Black Forest Labs正式宣布,其全新图像编辑模型 FLUX.1Kontext [dev] 现已开源,引发了AI社区的广泛关注。这一模型作为FLUX.1系列的最新成员,以其强大的图像编辑能力和高效性能被誉为可媲美GPT-4o的开源替代方案。FLUX.1Kontext [dev] 基于12亿参数的流匹配变换器架构,专为图像编辑任务设计,支持消费级硬件运行,为创作者、开发者和研究人员提供了

NVIDIA放大招!Llama-Nemotron-Nano-VL-8B-V1发布,图像视频文本全能,微调王座谁与争锋?

人工智能领域的竞争日趋白热化,NVIDIA再次以其强大的技术实力引领潮流。AIbase从社交媒体平台获悉,NVIDIA最新发布了Llama-3.1-Nemotron-Nano-VL-8B-V1,一款支持图像、视频和文本输入的视觉到文本模型,输出高质量文本并具备图像推理能力。这一模型的发布不仅展示了NVIDIA在多模态AI领域的雄心,也为开发者提供了高效的轻量化解决方案。本文将为您详细解析这款模型的

​ChatGPT iOS 应用上月下载量突破 3000 万,超越所有社交应用

ChatGPT 的 iOS 应用在过去28天内的下载量达到了2960万次,成为全球最受欢迎的应用。这一成绩使得 ChatGPT 在下载量上超过了 TikTok、Facebook、Instagram 和 X 这四大社交应用的总和,后者的下载量在同一时间段内约为3290万次,差距达到10.6%。虽然社交应用在市场上的推广时间较长,但 ChatGPT 在短时间内就取得了如此亮眼的成绩,显示出其强大的吸引