AI新词

通义千问正式发布Qwen3-Embedding系列模型

近日,通义千问官方正式发布了Qwen3-Embedding系列模型,作为Qwen模型家族的新成员,该系列模型专为文本表征、检索与排序任务而设计。Qwen3-Embedding系列基于Qwen3基础模型进行训练,充分继承了Qwen3在多语言文本理解能力上的显著优势。该系列模型在多项基准测试中表现出色,特别是在文本表征和排序任务中展现了卓越性能。测试使用了MTEB(包括英文版v2、中文版v1、多语言版

Claude Artifacts重磅上线!零代码打造AI应用,分享创意从此无界

近日,Anthropic宣布其旗舰AI模型Claude推出全新功能——Artifacts创作空间及应用发布分享功能。这一功能允许用户通过简单的对话快速创建、保存和分享AI驱动的应用,并将Claude的智能直接嵌入其中,无需复杂API配置。AIbase为您详细解读这一功能的亮点及其对AI创作生态的深远影响。Artifacts创作空间:从灵感变现实的AI工作台Claude的Artifacts创作空间为

Komiko视频到视频功能炸裂上线!AI一键打造动漫大片,漫画动画创作从未如此简单

Komiko平台宣布推出全新视频到视频(Video-to-Video)功能,进一步巩固其作为AI驱动的漫画、动画和插画一体化创作平台的领先地位。这一功能结合AI线稿上色、背景移除、图像增强和动画补帧技术,让用户仅需几分钟即可创作出专业品质的漫画和动画作品。AIbase为您深度解析Komiko的最新突破及其对创意产业的深远影响。视频到视频功能:一键转换,创意无限Komiko全新推出的视频到视频功能允

通义开源视觉感知多模态RAG推理框架VRAG-RL

近日,通义实验室自然语言智能团队正式发布并开源了VRAG-RL——一款视觉感知驱动的多模态RAG推理框架,旨在解决在真实业务场景中,AI如何从图像、表格、设计稿等视觉语言中检索关键信息并进行精细化推理的难题。在复杂视觉文档知识库中检索并推理关键信息,一直是AI领域的一大挑战。传统的检索增强型生成(RAG)方法在处理视觉丰富信息时显得力不从心,主要因为它们难以应对图像、图表等视觉内容,且现有视觉RA

Black Forest震撼开源FLUX.1 Kontext [dev]:媲美GPT-4o的图像编辑

Black Forest Labs正式宣布,其全新图像编辑模型 FLUX.1Kontext [dev] 现已开源,引发了AI社区的广泛关注。这一模型作为FLUX.1系列的最新成员,以其强大的图像编辑能力和高效性能被誉为可媲美GPT-4o的开源替代方案。FLUX.1Kontext [dev] 基于12亿参数的流匹配变换器架构,专为图像编辑任务设计,支持消费级硬件运行,为创作者、开发者和研究人员提供了

NVIDIA放大招!Llama-Nemotron-Nano-VL-8B-V1发布,图像视频文本全能,微调王座谁与争锋?

人工智能领域的竞争日趋白热化,NVIDIA再次以其强大的技术实力引领潮流。AIbase从社交媒体平台获悉,NVIDIA最新发布了Llama-3.1-Nemotron-Nano-VL-8B-V1,一款支持图像、视频和文本输入的视觉到文本模型,输出高质量文本并具备图像推理能力。这一模型的发布不仅展示了NVIDIA在多模态AI领域的雄心,也为开发者提供了高效的轻量化解决方案。本文将为您详细解析这款模型的

​ChatGPT iOS 应用上月下载量突破 3000 万,超越所有社交应用

ChatGPT 的 iOS 应用在过去28天内的下载量达到了2960万次,成为全球最受欢迎的应用。这一成绩使得 ChatGPT 在下载量上超过了 TikTok、Facebook、Instagram 和 X 这四大社交应用的总和,后者的下载量在同一时间段内约为3290万次,差距达到10.6%。虽然社交应用在市场上的推广时间较长,但 ChatGPT 在短时间内就取得了如此亮眼的成绩,显示出其强大的吸引

OpenAI升级AI智能体开发工具,支持TypeScript 、改进语音对话

OpenAI 宣布对其 AI 智能体开发工具进行了一系列重要升级。此次更新不仅提升了平台的兼容性,还对语音界面进行了优化,同时增强了可观测性(observability),使得开发者在构建 AI 智能体时能更加得心应手。OpenAI 为其 Agents SDK 新增了对 TypeScript 的支持。这一举措让 JavaScript 和 Node.js 环境下的开发者也能参与到智能体的开发中。新版

豆包「深入研究」功能在豆包APP、网页版及电脑版开启测试

近日,豆包APP、网页版及电脑版平台迎来新功能测试——「深入研究」功能已正式上线,供用户免费体验。该功能旨在助力用户高效处理复杂任务,通过快速整合海量深度信息,生成详尽的研究报告或可视化网页结果。无论是规划长途旅行、做出复杂购买决策,还是解读最新政策、追踪商业科技趋势,用户只需将豆包更新至最新版本,在App或PC端选择“深入研究”并输入具体指令,几分钟内即可获取定制化报告。此外,豆包App还支持将

ChatGPT业绩狂飙,年收入首次突破百亿大关!

在短短三年的时间里,美国人工智能研究公司 OpenAI 凭借其热门聊天机器人 ChatGPT,实现了令人瞩目的业绩,年化经常性收入(ARR)已突破100亿美元大关。根据最新数据显示,OpenAI 的 ARR 去年为约55亿美元,这意味着今年增长近80%。这样的飞速发展让人不禁感叹,人工智能市场的潜力实在不可小觑。ARR 是企业从订阅服务或产品中获得的预期年度收入,尤其适用于评估那些基于订阅模式(如