扩散模型 - AI学习站

英伟达与 MIT、香港大学联手推出 Fast-dLLM 框架，推理速度提升惊人

AI热点 1年前

英伟达与 MIT、香港大学联手推出 Fast-dLLM 框架，推理速度提升惊人

在最近的科技进展中，英伟达与麻省理工学院（MIT）和香港大学联合推出了名为 Fast-dLLM 的新框架，显著提升了扩散模型(Diffusion-based LLMs)的推理速度，最高可达27.6倍。这一创新的成果为语言模型的应用开辟了新天地。扩散模型被视为自回归模型的有力竞争者，采用了双向注意力机制，使其在理论上能够实现多词元同步生成，从而加快解码速度。然而，实际应用中，扩散模型在推理速度上却常

AI中国

AI中国

255 0

AI热点 1年前

Character.AI 推出 AvatarFX 模型：让静态图片中的人物“开口说话”

Character.AI 近日宣布推出全新视频生成模型 AvatarFX，这一突破性技术能够将静态图片转化为具有真实感的可说话视频角色，赋予图像中的人物动态表情、唇部同步以及自然肢体动作。AvatarFX 的核心是其最先进的基于扩散模型的动态生成技术。该技术依托经过精心筛选的数据集进行训练，融合了创新的音频条件化、蒸馏和推理策略，使得用户能够以极高的速度生成高保真、时间一致性强的视频。无论是长序列

AI中国

AI中国

351 0

EasyControl：让DiT模型拥有ControlNet般强大操控，支持吉卜力画风转换

AI热点 1年前

EasyControl：让DiT模型拥有ControlNet般强大操控，支持吉卜力画风转换

在人工智能绘画领域，扩散模型（Diffusion Model）正经历从基于Unet架构向基于Transformer架构(DiT)的转变。然而，DiT生态系统在插件支持、效率以及多条件控制等方面仍面临挑战。近日，由Xiaojiu-z领衔的团队推出了名为EasyControl的创新框架，旨在为DiT模型提供高效且灵活的条件控制能力，犹如为DiT模型装上了强大的“ControlNet”。EasyCont

AI中国

AI中国

352 0

腾讯全新AI绘画升级！微调技术让生成图像美感提升300%

AI热点 8月前

腾讯全新AI绘画升级！微调技术让生成图像美感提升300%

近日，腾讯推出了一种新方法，旨在提升 AI 生成图像的真实感与美学评分。据悉，这一微调技术在仅用32块 H20显卡训练10分钟后就能实现显著的收敛效果，其人工评估得分甚至提升了300% 以上。当前的扩散模型虽然能够借助奖励机制来优化图像质量，但却面临着一些挑战。首先，模型优化步骤较少，容易出现所谓的 “奖励作弊” 现象，即模型为了获取高分而生成质量较低的图像。其次，离线调整奖励模型的过程不够灵活，

AI中国

AI中国

231 0

AI热点 1年前

PlayDiffusion发布：开源扩散模型实现语音“局部修改”不留痕

Play AI 日前开源推出了一款全新语音编辑模型——PlayDiffusion，这是一种基于扩散模型的创新性工具，专为语音局部修改而设计。不同于传统的文本转语音系统需对整段音频重生成，PlayDiffusion 支持直接对语音中的某一部分进行替换、删除或调整，而其他未修改部分将保持完全一致。这种方式不仅极大提高了效率，也让音频编辑进入“所听即所得”的新阶段。用户只需提供目标文本（例如将音频中的“

AI中国

AI中国

251 0

3DV-TON革新视频试穿，扩散模型驱动纹理3D一致性新体验

AI热点 1年前

3DV-TON革新视频试穿，扩散模型驱动纹理3D一致性新体验

一款名为3DV-TON（Textured3D-Guided Consistent Video Try-on via Diffusion Models）的创新技术正式亮相，通过扩散模型实现纹理3D引导的视频试穿体验。据AIbase了解，3DV-TON利用先进的3D几何与纹理建模，结合视频扩散模型，确保服装在动态视频中的一致性与真实感，为电商、时尚和虚拟现实领域带来突破性应用。相关细节已通过学术平台与

AI中国

AI中国

208 0

国产AI崛起！17亿参数开源图像模型HiDream-I1横空出世

AI热点 1年前

国产AI崛起！17亿参数开源图像模型HiDream-I1横空出世

当代码的力量遇上艺术的灵感，新一代人工智能正在悄然改变创意世界的边界。近日，国产开源图像生成模型HiDream-I1震撼发布，凭借17亿参数的技术底蕴，这款由HiDream-ai团队倾力打造的AI"画匠"正迅速成为科技圈新宠。这款基于扩散模型技术的开源图像生成工具，能够将文本描述转化为高质量图像，在细节渲染和图像一致性方面展现出令人瞩目的实力。初步测试显示，HiDream-I1在色彩还原、边缘处理

AI中国

AI中国

390 0

Sora底层技术架构:Diffusion Transformer的论文、项目和源码

视频教程 1年前

Sora底层技术架构:Diffusion Transformer的论文、项目和源码

AI中国

AI中国

290 0

英伟达与MIT合作推出 Fast-dLLM 框架，AI 推理速度提升 27.6 倍

AI热点 1年前

英伟达与MIT合作推出 Fast-dLLM 框架，AI 推理速度提升 27.6 倍

近日，科技巨头英伟达联合麻省理工学院（MIT）与香港大学，发布了名为 Fast-dLLM 的新框架。这一创新的框架旨在显著提高扩散模型(Diffusion-based LLMs)的推理速度，最高可达27.6倍，为人工智能的应用提供了更为强大的技术支持。扩散模型的挑战与机遇扩散模型被视为传统自回归模型（Autoregressive Models）的有力竞争者。它采用双向注意力机制(Bidirect

AI中国

AI中国

216 0

新框架d1引领扩散模型推理进步，掀起强化学习应用新风潮

AI热点 1年前

新框架d1引领扩散模型推理进步，掀起强化学习应用新风潮

在人工智能的不断发展中，扩散模型在推理能力上逐渐崭露头角，现如今，它们不再是自回归模型的 “跟随者”。近日，来自加州大学洛杉矶分校（UCLA）和 Meta 的研究者们联合推出了一种名为 d1的新框架，该框架结合了监督微调(SFT)和强化学习(RL)，使扩散模型具备更强的推理能力，包括数学理解、逻辑推理等。这一创新的 d1框架通过两阶段的后训练策略来提升掩码大语言模型（dLLM）的性能。在第一阶段，

AI中国

AI中国

366 0

热门标签

巨日禄AI ai提示詞语音控制 LearnYourWay 国际仲裁学会(Ciarb) 无货源电商智驾技术小美满汽车芯片橘猫

热门作者

作者头像

AI科技前沿

102篇文章

作者头像

机器学习笔记

87篇文章

作者头像

AI绘画大师

64篇文章

热门阅读

1

6种AI声音克隆工具，听说还有99%的人不知道（建议收藏）

2084 阅读

2

蛋仔派对：看别人让豆包看图片猜人物，我便让他认一下蛋仔皮肤！

2026 阅读

3

WMS 系统「入库管理」功能详解

1765 阅读

4

3个颠覆认知的AI学习真相，90%的人都想错了！

1635 阅读

5

协作机器人HMI优化指南：从示教器到控制软件的可用性与性能升级

1458 阅读

6

YouMind: 你的AI创作新范式

1418 阅读

7

0代码经验，半天时间，我用Cursor从0到1开发了微信小程序并上线，附教程+提示词

1400 阅读

8

AI制作ASMR视频也能火爆全网，沉浸式切水果视频教程

1346 阅读

9

速抢（2核2G）77元/年香港免备案服务器

1269 阅读

10

可口可乐，你浓眉大眼的也用AI做广告了？

1186 阅读

11

分享4个超简单的DeepSeek提示词公式，让你的DeepSeek秒懂你

1132 阅读

12

即梦AI图片3.0智能参考图指南，也能一句话做出爆款设计了

1095 阅读

13

怎样才能制作出一个数字人？一分钟教你完成AI数字人制作

1021 阅读

14

扣子节点文本转Word攻略：4步搞定，告别手动排版！

1002 阅读

15

别再花钱去拍形象照了，教你一键制作大师级人物摄影照

1001 阅读

16

全新SkyReels正式上线

979 阅读

17

我用一张表格，把带娃从“鸡飞狗跳”变成“母慈子孝”！

961 阅读

18

拼多多直通车优化技巧

961 阅读

19

靠AI做美食图？小白也能轻松制作出让人垂涎欲滴的美食照片

925 阅读

20

我用腾讯3D Studio让原神的芙宁娜活了，能跑还能打

911 阅读