AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、通义千问正式发布Qwen3-Embedding系列模型我作为一名AI助手,对通义千问团队推出Qwen3-Embedding系列模型感到非常兴奋。这款新模型不仅在多语言文本理解和检

​Snap 推出 Lens Studio iOS 和网页应用,简化 AR 镜头创作流程

Snap 公司近日宣布推出全新的 Lens Studio iOS 应用和网页工具,这一举措旨在让更多人轻松创建增强现实(AR)镜头。通过这些新工具,用户可以使用文本提示和简单的编辑工具,快速生成自己的 AR 效果,增添个人化的元素。新推出的 Lens Studio 应用程序允许用户生成 AI 效果、添加个人的 Bitmoji 形象,并浏览流行模板,以便自定义自己的 AR 镜头。此前,Lens St

智源研究院推出Emu3等“悟界”系列大模型

在刚刚闭幕的第七届 “北京智源大会” 上,智源研究院重磅推出了一系列名为 “悟界” 的大模型。这些模型的发布标志着人工智能领域又一次技术的飞跃,吸引了众多科技爱好者的目光。此次发布的模型包括原生多模态世界模型 Emu3、脑科学多模态通用基础模型见微 Brainμ、以及跨本体的具身大小脑协作框架 RoboOS2.0和具身大脑 RoboBrain2.0。此外,还有全原子微观生命模型 OpenCompl

阿里开源千问3向量模型,性能大幅提升,挑战谷歌和OpenAI

在人工智能技术快速发展的今天,阿里巴巴于6月6日正式开源了其全新的千问3向量模型系列 ——Qwen3-Embedding。该模型是基于千问3底座,为文本表征、检索和排序等任务进行优化,标志着阿里在 AI 领域的又一重大突破。相较于前一版本,Qwen3-Embedding 在文本检索、聚类和分类等核心任务上的性能提升了超过40%。这一进步不仅让它在技术上更具竞争力,还使得它在 MTEB 等专业榜单中

Trae 集成 Gemini 2.5 Pro Preview,Web 应用开发迎来新突破

 根据最新消息,Trae 平台已完成更新,正式支持 Google 最新发布的 Gemini2.5Pro Preview(I/O 版)模型。这一升级使 Trae 在前端开发和用户界面(UI)设计领域迈出重要一步,为开发者提供更强大的工具支持。据悉,Gemini2.5Pro Preview 在 WebDev Arena 排行榜上荣登榜首,Elo 分数较前一版本提升35点,达到1443分,超越了 Cla

OpenAudio 发布开源 TTS 模型 S1-Mini:0.5B 参数打造超自然 AI 语音

AI 语音技术领域迎来重要进展,Fish Audio 宣布开源其全新文本转语音(TTS)模型 OpenAudio S1-Mini。作为广受好评的 S1模型的精简版,S1-Mini 以其轻量化设计、高表现力和多语言支持引发行业热议。技术亮点:轻量化与高性能兼得OpenAudio S1-Mini 是从4B 参数的 S1模型蒸馏而来的轻量化版本,仅包含0.5B 参数,大幅降低计算需求,适合在资源受限的环

AI驱动本地视频编辑工具Diffusion Studio Pro,号称“CapCut + Cursor”结合

AI 驱动的视频编辑工具 Diffusion Studio Pro 正式亮相,引发行业广泛关注。这款号称“CapCut + Cursor”结合的创新产品,以本地优先、浏览器为基础的非线性编辑体验,集成超过16种生成式 AI 模型,为专业视频创作者和开发者提供强大支持。核心亮点:多模态 AI 赋能非线性编辑Diffusion Studio Pro 是一款完全基于 AI 的本地视频编辑工具,运行于浏览

字节跳动发布图像编辑模型SeedEdit 3.0 细节保持能力进一步提升

6月6日,字节跳动Seed团队正式发布了图像编辑模型SeedEdit3.0。这一全新版本的图像编辑模型在图像主体保持、背景细节处理以及指令遵循等方面取得了显著进步,极大地提升了图像编辑的可用率和效率。SeedEdit3.0是基于文生图模型Seedream3.0开发的,通过引入多样化的数据融合方法和特定奖励模型,解决了以往图像编辑模型在主体与背景保持、指令遵循等方面的不足。该模型能够处理并生成4K分

ElevenLabs推出V3声音模型:支持70多种语言,可通过标签控制情感、语气

全球领先的 AI 语音技术公司 ElevenLabs 正式发布了其最新文本转语音模型 Eleven v3(Alpha 版),被誉为迄今最具表现力的 AI 语音模型。这一突破性进展不仅提升了语音合成的自然度和情感表达能力,还为内容创作者和开发者提供了更强大的工具,助力视频、音频书和多媒体工具的开发。技术突破:更自然的对话与情感表达Eleven v3引入了全新的架构,能够更深入地理解文本语义,显著提升

谷歌重磅新作!Portraits让你与虚拟专家对话,解锁沟通与领导力秘籍

2025年6月5日,谷歌悄然推出了一款名为 Portraits 的创新AI产品,通过虚拟专家对话为用户提供个性化的学习体验。这款产品允许用户与预设的虚拟专家进行实时互动,学习专业领域的知识与技能。首批虚拟专家之一是畅销书《Radical Candor》和《Radical Respect》的作者,专注于教授沟通技巧与领导力内容。AIbase为您独家解析Portraits的亮点与潜力。创新功能:与虚拟