AI视频制作教程 | 从脚本生成到智能剪辑的完整解决方案 - AI学习站

OmniVinci – NVIDIA推出的全模态大语言模型

Top

AI视频 5月前 • 723

OmniVinci – NVIDIA推出的全模态大语言模型

OmniVinci是什么OmniVinci是NVIDIA推出的全模态大语言模型，专门处理视觉、听觉、语言和推理的多模态任务。通过独特的OmnialignNet技术实现跨模态语义对齐，Temporal Embedding Grouping机制解决时序同步问题，采用Constrained Rotary Time Embedding优化时间感知能力。在Dailyomni等基准测试中，性能超越Qwen

AI中国

AI中国

MiroFlow – 多Agent系统开发框架，支持高并发处理

AI视频 8月前

MiroFlow – 多Agent系统开发框架，支持高并发处理

MiroFlow是什么MiroFlow是强大的多智能体系统开发框架，专为构建复杂、高性能的AI智能体而设计，为MiroThinker等模型生成高质量的智能体轨迹数据。框架具备可复现的性能，在GAIA验证集上稳定达到72.2%的通过率。框架支持高并发和容错，内置可观测性和评估工具，方便调试和优化。MiroFlow用模块化设计，支持多轮对话、丰富的工具集成和分层子智能体架构，能灵活处理复杂任务。M

AI中国

AI中国

215 0

Baichuan-M2 – 百川智能推出的开源医疗增强大模型

AI视频 8月前

Baichuan-M2 – 百川智能推出的开源医疗增强大模型

Baichuan-M2是什么Baichuan-M2 是百川智能推出的开源医疗增强大模型。在医疗领域表现卓越，于HealthBench评测中以60.1分超越OpenAI的gpt-oss120b等众多开源模型，登顶世界第一。通过极致轻量化，可在RTX 4090单卡上部署，成本大幅降低。其MTP版本在单用户场景下token速度提升74.9%，适用于急诊、门诊等场景。Baichuan-M2在数学、写作

AI中国

AI中国

187 0

SkyReels-A3 – 昆仑万维推出的数字人视频生成模型

AI视频 8月前

SkyReels-A3 – 昆仑万维推出的数字人视频生成模型

SkyReels-A3是什么SkyReels-A3是昆仑万维推出的先进AI模型，基于DiT（Diffusion Transformer）视频扩散架构，结合插帧、强化学习和运镜控制技术。模型能通过音频驱动，将照片或视频中的人物“激活”，使其开口说话或表演。用户只需上传人像图片和音频，能生成自然流畅的视频内容，支持长达60秒的单分镜输出和无限时长的多分镜创作。模型在口形同步、动作自然性和运镜效果上

AI中国

AI中国

133 0

AionUi – 开源的AI聊天界面，支持Gemini CLI命令行

AI视频 8月前

AionUi – 开源的AI聊天界面，支持Gemini CLI命令行

AionUi是什么AionUi 是基于 Electron 和 React 构建的免费、开源、跨平台桌面应用，支持将 Gemini CLI 的命令行 AI 聊天体验转化为现代化、高效的图形界面。AionUi 提供增强的聊天功能，支持多会话管理、本地持久化历史记录和自然的聊天交互。工具具备强大的文件与项目管理能力，如可视化文件树、文件上传和代码对比视图。AionUi 集成完整的 Gemini AP

AI中国

AI中国

194 0

AI视频 8月前

Free AI Random Image Generator

Free AI Random Image Generator 是什么？Free AI Random Image Generator 是一款零门槛的在线 AI 绘图工具，用户只需点击几下，就能生成独特的数字艺术作品、抽象背景或创意插画。它支持完全随机创作，也允许用户通过关键词、风格和参数定制输出效果。无论你是专业设计师还是零美术基础的小白，都可以轻松产出高质量的视觉素材，并且生成的图片可直接商用

AI中国

AI中国

162 0

AI视频 8月前

Reve AI

我已经帮你把 Reve AI 的详细介绍整理成一份带 SEO优化 TDK 的中英文双版本网页文案，可以直接用于网站发布。Reve AI 是什么？Reve AI 是由 Halfmoon AI 开发的创新型 AI 图片生成平台，利用先进的 Reve Image 1.0 模型将文字描述精准转换为高质量艺术图像。它的核心优势包括：上下文感知的提示解释器：精准理解文字描述与视觉概念。专用字体渲

AI中国

AI中国

223 0

AI视频 8月前

GrokGhibli

GrokGhibli 是什么？GrokGhibli 是一个基于 Grok AI 技术的 AI 绘图平台，专注于生成吉卜力（Studio Ghibli）风格的图像。它能将用户的文本提示或上传的照片转换为充满宫崎骏风格的艺术作品，无论是奇幻角色、梦幻风景，还是日常场景，都能精准还原吉卜力的色彩、光影与绘画质感。它的目标是让任何人都能轻松体验到创作吉卜力风格作品的乐趣。GrokGhibli

AI中国

AI中国

172 0

AI视频 8月前

Ghibli AI Generator

Ghibli AI Generator 是什么？Ghibli AI Generator 是一款基于 GPT-4o 与先进图像算法的在线工具，专注于将普通照片转化为宫崎骏吉卜力风格的艺术作品。它能够在几分钟内，将你的照片赋予吉卜力电影特有的温暖色彩、柔和光影和手绘质感，非常适合制作个性化插画、壁纸、社交媒体内容，甚至可作为创作灵感参考。Ghibli AI Generator 应用场景

AI中国

AI中国

204 0

AI视频 8月前

Seedance AI Video Generator

Seedance AI Video Generator 是什么？Seedance AI Video Generator 是由字节跳动（ByteDance）开源的最新一代 AI 视频生成平台 Seedance 1.0，采用多阶段架构（Multi-Stage Architecture），结合扩散模型与 Transformer 规划，实现了高质量、长时长与高速度兼备的“AI 视频三难平衡”突破。

AI中国

AI中国

139 0

AI视频 8月前

Name Generator

Name Generator 是什么？YMM Name Generator 是一个功能全面的在线取名与创意命名平台，支持从婴儿取名、用户名、品牌名，到奇幻角色、游戏团队、虚拟城市等多种场景的名称生成。它的数据库涵盖全球不同文化和语言的名字，还能根据性别、流行度、出生年份、国家和性格特征等条件进行筛选。无论是现实用途（宝宝取名、团队命名），还是虚构创作（小说角色、游戏世界），YMM Name

AI中国

AI中国

240 0

AI视频 8月前

ASMR Video AI Generator

ASMR Video AI Generator 是什么？ASMR Video AI Generator 是一款基于 Veo3 AI 的在线 ASMR 视频生成平台，可以根据用户描述自动生成带有特定触发元素的 ASMR（自主感觉经络反应）视频。它不仅能合成高质量的 ASMR 声音（包括双耳环绕音效、低语、敲击、摩擦声等），还可以创建对应的视频画面，用于睡眠辅助、减压、冥想或商业化 ASMR 内

AI中国

AI中国

205 0

WrenAI – 开源的商业AI Agent工具，自然语言生成SQL

AI视频 8月前

WrenAI – 开源的商业AI Agent工具，自然语言生成SQL

WrenAI是什么WrenAI 是 Canner 推出的开源商业智能 AI Agent工具。通过自然语言交互，帮助用户快速查询、分析和可视化结构化数据，无需编写复杂的 SQL 代码。用户只需用普通语言提出问题，WrenAI 能生成精准的 SQL 查询语句，以图表、报告等多种形式输出结果。通过架构嵌入和相关性检索，确保查询的准确性和上下文对齐。支持多种主流数据库（如 PostgreSQL、MyS

AI中国

AI中国

148 0

KittenTTS – KittenML开源的轻量级文本转语音模型

AI视频 8月前

KittenTTS – KittenML开源的轻量级文本转语音模型

KittenTTS是什么KittenTTS 是轻量级开源文本转语音（TTS）模型，由 KittenML 团队开发。以极小的模型体积（仅 25MB）和强大的 CPU 优化为特点，无需 GPU 即可在低功耗设备上运行，KittenTTS 提供 8 种预置音色（4 男 4 女），支持多语言（目前主要支持英语），可通过 ONNX/PyTorch 格式集成到各种应用中。首次运行时会下载权重并缓存到本地，

AI中国

AI中国

122 0

DreamVVT – 字节联合清华推出的视频虚拟试穿技术

AI视频 8月前

DreamVVT – 字节联合清华推出的视频虚拟试穿技术

DreamVVT是什么DreamVVT 是字节跳动和清华大学（深圳）联合推出的视频虚拟试穿（Video Virtual Try-On, VVT）技术，基于扩散 Transformer（DiTs）框架，通过两阶段方法实现高保真且时间连贯的虚拟试穿效果。第一阶段从输入视频中采样关键帧，结合视觉语言模型（VLM）生成语义一致的试穿图像；第二阶段利用骨骼图和运动信息，结合预训练视频生成模型，确保视频的

AI中国

AI中国

209 0

AI视频 8月前

Trenz

Trenz 是什么？Trenz 是一款专注于 TikTok 商业化变现的 AI 驱动数据分析与创作辅助平台，帮助创作者、机构和电商卖家精准发现 TikTok 热门产品、爆款视频、趋势创意和高转化内容策略。通过 Trenz，用户可以实时追踪 TikTok Shop 上的畅销商品、最受欢迎的创作者、爆款视频脚本和钩子，并利用 AI 工具快速生成高转化视频脚本、内容结构和创意灵感。其目标是让内

AI中国

AI中国

172 0

AI视频 8月前

Runway Aleph

Runway Aleph 是什么？Runway Aleph 是一款基于先进“上下文视频生成模型（in-context video model）” 的 AI 视频创作与编辑平台。与传统视频生成工具不同，它不仅能从零生成视频，还能理解和编辑已有视频素材，通过自然语言指令实现多任务视觉处理，包括镜头角度变化、物体增删、环境替换、光影调整、艺术风格转换等，且保证运动一致性与电影级画质。它面向创作者

AI中国

AI中国

173 0

AI视频 8月前

AI Silhouette Generator

AI Silhouette Generator 是什么？AI Silhouette Generator 是一款免费的在线 AI剪影生成器，无需注册即可将任何照片快速转化为高质量的剪影艺术作品。它采用先进的机器学习与智能边缘检测算法，能精准识别主体轮廓并自动生成干净、流畅的剪影边界，适用于人像、动物、建筑、产品等多种图片类型。该工具同时提供背景模板库和多种导出格式，适合设计师、营销人员、艺术

AI中国

AI中国

217 0

AI视频 8月前

Reezo AI

Reezo AI 是什么？Reezo AI 是一款专注于短视频创意提示生成的 AI 工具，能够根据实时社交媒体趋势（TikTok、Instagram、YouTube 等）生成高病毒传播潜力的视频创作提示（video prompts）。它不仅提供创意，还会基于 2.8M+ 爆款视频数据进行“病毒预测评分”，并针对不同平台自动优化脚本结构、镜头语言、标签策略等，让创作者从“盲目拍”变成“数

AI中国

AI中国

188 0

Glass – 开源AI桌面助手，实时捕捉屏幕内容和音频识别

AI视频 8月前

Glass – 开源AI桌面助手，实时捕捉屏幕内容和音频识别

Glass是什么Glass 是Pickle 团队推出的开源隐形 AI 桌面助手。Glass能在后台实时捕捉屏幕内容和音频，将其转化为结构化知识。Glass核心功能包括实时会议记录、自动摘要生成、上下文理解及实时问答。Glass 的设计真正隐形，不会出现在屏幕录制、截图或 Dock 中，完全不干扰用户操作。Glass支持 macOS 和 Windows 系统，用户能免费使用，且无需注册。Glas

AI中国

AI中国

161 0

AI视频 8月前

个知AI工作站

个知AI工作站是什么？“个知AI工作站” 是由个推（Getui）推出的一款集软件与硬件为一体的 AI 工具，整合了 DeepSeek 的“满血版大模型”。这款智算一体机主打快速落地 AI，适配办公、写作、科研等多种场景，承诺“开箱即用”式体验。应用场景根据宣传，该工作站适用于多种实际需求：日常工作提效（快问快答）深度思考与建议生成（多维建议）科研与专业决策（数据支撑）应用覆盖

AI中国

AI中国

239 0

AI视频 8月前

Boba Anime

Boba Anime 1.3 是什么？Boba Anime 1.3 是由 Boba Labs 推出的前沿 AI 动漫生成模型，能够将文字、图片转化为高质量的动漫短片、静态画面和电影级镜头。它支持从 Text to Video、Text to Image 到 Image to Video 的全流程创作，并内置声音生成、对白、音效、角色口型同步等多模态功能，让你的动漫角色在数秒内“活”起来。

AI中国

AI中国

184 0

AI视频 8月前

猫眼课题宝

猫眼课题宝是什么？猫眼课题宝是由见鲸科技（南京）有限公司推出的一款科研选题与课题申报智能服务平台，基于自主研发的鲸灵AI科研大模型，依托 828 万+基金数据与 1.6 亿+文献数据深度训练，为科研人员提供智能选题、标书生成、基金分析、文献分析、学科趋势预测、选题订阅及科研课程等全链路服务，助力科研人员精准高效完成课题立项与申报。应用场景智能选题：从海量基金与文献数据

AI中国

AI中国

153 0

AI视频 8月前

AI Change Background

AI Change Background 是什么？AI Change Background 是一款基于人工智能的在线背景替换工具，能够在数秒内精准识别图片主体，并根据用户提供的文本提示生成全新的背景。无需模板库，只需一句话，就能为电商、创作者、设计师和各类专业人士提供高质量的背景更换与创意场景生成服务。无论是白底产品图、艺术写真，还是创意内容制作，都能实现专业化效果。AI Change B

AI中国

AI中国

123 0

AI视频 8月前

Polygraf AI

Polygraf AI 是什么？Polygraf AI 是一款专注于AI生成内容检测、版权保护、数据隐私安全与内容优化的全栈式AI安全工具平台。它利用先进的机器学习和自然语言处理技术，帮助用户快速识别 AI 生成或篡改的文本与媒体内容，同时保护个人和企业的敏感信息不被泄露。该平台不仅能检测 ChatGPT、Gemini、Claude 等 AI 模型生成的内容，还支持深度分析、抄袭检测、人类化

AI中国

AI中国

211 0

Awesome AI Agents – e2b-dev推出的AI Agent大合集GitHub

AI视频 8月前

Awesome AI Agents – e2b-dev推出的AI Agent大合集GitHub

Awesome AI Agents是什么Awesome AI Agents是e2b-dev维护的GitHub仓库，汇集和展示各种人工智能代理（AI Agents）相关的开源项目、闭源项目以及相关公司。仓库内容分为两部分：开源项目和闭源项目及公司。涵盖了从通用目的到特定领域（如编码、数据处理、商业智能等）的各种AI代理工具和框架。为开发者和研究人员提供了一个探索AI代理的平台，鼓励社区通过Pul

AI中国

AI中国

202 0

NeuralAgent – 开源的桌面AI助手，自然语言执行复杂任务

AI视频 8月前

NeuralAgent – 开源的桌面AI助手，自然语言执行复杂任务

NeuralAgent是什么NeuralAgent 是开源的桌面 AI 个人助手，通过自然语言指令自动化执行多种复杂任务，如模拟键盘输入、鼠标点击、浏览器导航、表单填写和邮件发送等。NeuralAgent 支持桌面自动化，在 Windows 平台上支持后台浏览器控制，实现高效任务处理。NeuralAgent 集成 Claude、GPT-4、Azure OpenAI、Bedrock、Ollama

AI中国

AI中国

195 0

self-llm – 专为中国开发者推出的开源大模型教程

AI视频 8月前

self-llm – 专为中国开发者推出的开源大模型教程

self-llm是什么self-llm （开源大模型食用指南）是Datawhale专为国内初学者打造的开源大模型教程，基于Linux平台，提供从环境配置到模型部署、微调的全流程指导，涵盖LLaMA、ChatGLM等主流模型。项目能简化开源大模型的使用流程，帮助学生和研究者快速上手。教程提供多种模型的详细教程、微调方法（如LoRA、ptuning）及应用案例，适合不同层次的学习者。项目鼓励社区参

AI中国

AI中国

261 0

WeKnora – 腾讯开源的文档理解与语义检索框架

AI视频 8月前

WeKnora – 腾讯开源的文档理解与语义检索框架

WeKnora是什么WeKnora 是腾讯开源的基于大语言模型（LLM）的文档理解与语义检索框架。框架基于模块化设计，支持多模态文档解析（如 PDF、Word、图片等），通过 RAG（检索增强生成）机制实现精准问答。WeKnora 提供强大的多模态认知引擎、灵活的检索策略、私有化部署和开箱即用的 Web UI 界面，适用于企业知识管理、科研文献分析、法律合规审查等场景，支持本地化部署和微信生态

AI中国

AI中国

158 0

LandPPT – 开源AI PPT生成工具，简化三步工作流

AI视频 8月前

LandPPT – 开源AI PPT生成工具，简化三步工作流

LandPPT是什么LandPPT 是AI演示文稿生成平台，能将文档内容快速转换为专业的 PPT 演示文稿。LandPPT支持 OpenAI、Claude、Gemini 等多种 AI 模型，兼容 PDF、Word、Markdown 等文件格式，支持智能解析内容，生成结构清晰的大纲和精美的 PPT 页面。平台提供丰富的模板系统和自定义功能，用户基于现代化的 Web 界面进行可视化编辑、实时预览和

AI中国

AI中国

149 0

GitMCP – 开源MCP服务器，可将GitHub仓库转为实时文档中心

AI视频 8月前

GitMCP – 开源MCP服务器，可将GitHub仓库转为实时文档中心

GitMCP是什么GitMCP 是开源的远程 Model Context Protocol (MCP) 服务器，能将 GitHub 仓库（包括代码库和 GitHub 页面）转变为实时文档中心，让 AI 工具（如 Cursor）直接访问最新文档和代码，消除代码幻觉提高代码准确性。GitMCP支持特定仓库和通用服务器两种模式，用户能根据需求选择。GitMCP 无需安装，零配置，支持嵌入式聊天，完全

AI中国

AI中国

216 0

推荐文章

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • AI热点

股票AI量化分析工具有那些？分享3个AI股票量化开源神器

股票AI量化分析工具有那些？分享3个AI股票量化开源神器

11月前 • 学习教程

苹果四位 AI 大将出走，其中三位是华人

苹果四位 AI 大将出走，其中三位是华人

7月前 • AI热点

宇树科技 CEO 王兴兴谈机器人新品 R1 定价：希望以更好的价格让更多人愿意采购、使用

宇树科技 CEO 王兴兴谈机器人新品 R1 定价：希望以更好的价格让更多人愿意采购、使用

8月前 • AI热点

【全88集】2025B站最全的AI视频全套教程！从剧本生成到视频制作全流程讲解！零基础小白适用！学完直接变现！（附工具）

【全88集】2025B站最全的AI视频全套教程！从剧本生成到视频制作全流程讲解！零基础小白适用！学完直接变现！（附工具）

10月前 • 视频教程

新工具来袭！BentoML发布llm-optimizer，助你轻松优化LLM推理性能

新工具来袭！BentoML发布llm-optimizer，助你轻松优化LLM推理性能

7月前 • AI热点

人工智能助力医疗行业新发展：Hellocare.ai、SignalFire 等公司获重大融资

人工智能助力医疗行业新发展：Hellocare.ai、SignalFire 等公司获重大融资

1年前 • AI热点

08月11日最新免费，不翻墙，国内无限制使用GPT-5和ChatGPT4o+Deepseek满血版+Midjourney绘画，无需账号，随便用

08月11日最新免费，不翻墙，国内无限制使用GPT-5和ChatGPT4o+Deepseek满血版+Midjourney绘画，无需账号，随便用

8月前 • 视频教程

热门标签

引流独立站 MAI-DxO Stable Diffusion 场景建模数字人短视频视频上传分析 AI美发 VSCO 讯飞星火认知大模型公司注册信息 AI制图教程

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝