AI学习站
首页 AI热点 AI教程
用户头像

标准会员

会员时间

积分 0

历史 通知(0)
首页
AI动态
技术前沿
工具与教程
大模型
AI投资分析
AI落地
AI政策法规

登录账号

忘记密码?

还没有账号? 立即注册

我已阅读并同意用户协议和隐私政策

已有账号? 立即登录

三行代码实现实时语音转文本,支持自动断句和语音唤醒,用 RealtimeSTT 轻松创建高效语音 AI 助手
学习教程 1年前

三行代码实现实时语音转文本,支持自动断句和语音唤醒,用 RealtimeSTT 轻松创建高效语音 AI 助手

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!🥦 微信公众号|搜一搜:蚝油菜花 🥦🚀 快速阅读功能:支持实时语音转文本,自动检测说话的开始与结束,具备唤醒词激活功能。技术:采用 WebRTCVAD 和 SileroVAD 进行语音活动检测,Fas

AI中国 AI中国
162 0
ClearerVoice-Studio:阿里通义开源的语音处理框架,提供语音增强、分离和说话人提取等功能
学习教程 1年前

ClearerVoice-Studio:阿里通义开源的语音处理框架,提供语音增强、分离和说话人提取等功能

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!🥦 微信公众号|搜一搜:蚝油菜花 🥦🚀 快速阅读功能:ClearerVoice-Studio 提供语音增强、分离和目标说话人提取等功能。技术:基于复数域深度学习算法,结合先进的模型架构如 FRCRN 和 MossForm

AI中国 AI中国
288 0
Comfyui真人照片转卡通风格图像工作流讲解,comfyui工作流分享
学习教程 1年前

Comfyui真人照片转卡通风格图像工作流讲解,comfyui工作流分享

最近在 AI 圈子里,有个超火的玩法刷屏了各大社群、论坛、B站剪辑区、甚至二创圈——“真人转卡通手办”。你没看错,只需要一张真人照片,就能一键生成专属你的Q版手办头像,质感直接拉满,宛如实体盲盒中走出来的小人偶!这背后可不是什么魔法,而是通过 ComfyUI 精心搭建的一套 33节点的重工流程完成的。今天我们就来深挖这套流程到底做了啥,**AI 是如何炼出“高仿手办”的?**整套流程到底靠不

AI中国 AI中国
300 0
用AI学习生财有术,是我快速拉齐信息差、认知差的杠杆解
学习教程 1年前

用AI学习生财有术,是我快速拉齐信息差、认知差的杠杆解

不知不觉,从去年 6 月开始转行做一人 AI 公司,到 11 月正式 AI 创业快 1 年了,经常有朋友问:你如何这么快适应一个新领域的?你是如何这么快知道小红书,公众号,视频号的流量规则或者变现方式的?你从哪里知道这么多的副业项目,变现方式的。先说结论:一个公式AI+优质信息源(input) = What \why \how(output)今天的文章希望对大家有一些启发。

AI中国 AI中国
204 0
DeepSeek+Coze实战:从0到1打造对标账号监控智能体(万字图文)
学习教程 1年前

DeepSeek+Coze实战:从0到1打造对标账号监控智能体(万字图文)

 大家好,我是汤师爷,专注AI智能体分享~如果你是短视频小白,正在做短视频运营,一定遇到过这样的问题。"对标账号今天又发了什么视频?""为什么他们的视频互动这么高?"每天盯着对标账号,手动记录他们的数据,这太折磨人了。但如果不这样做,又担心错过重要信息,落后一步。今天,我要教你一个省时省力的方法,利用对标账号监控智能体,让对标账号监控变得简单又高效。只需要简单设置,就能自动追踪

AI中国 AI中国
168 0
亚马逊推出AI语音模型新标杆!Nova Sonic:多语言识别错误率仅4.2%,碾压GPT-4o-transcribe
学习教程 1年前

亚马逊推出AI语音模型新标杆!Nova Sonic:多语言识别错误率仅4.2%,碾压GPT-4o-transcribe

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦🎙️ "OpenAI 颤抖吧!亚马逊Nova Sonic语音模型错误率碾压GPT-

AI中国 AI中国
227 0
GPT-4o-mini-transcribe:OpenAI 推出实时语音秒转文本模型!高性价比每分钟0.003美元
学习教程 1年前

GPT-4o-mini-transcribe:OpenAI 推出实时语音秒转文本模型!高性价比每分钟0.003美元

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦🎙️ 「录音整理下岗!OpenAI黑科技让语音秒变文本,手机都能跑」大家好,我是

AI中国 AI中国
239 0
Freestyler:微软联合西工大和香港大学推出说唱音乐生成模型,支持控制生成的音色、风格和节奏等
学习教程 1年前

Freestyler:微软联合西工大和香港大学推出说唱音乐生成模型,支持控制生成的音色、风格和节奏等

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!🥦 微信公众号|搜一搜:蚝油菜花 🥦🚀 快速阅读模型介绍:Freestyler是由西北工业大学、微软和香港大学联合推出的说唱乐生成模型,能够根据歌词和伴奏生成说唱音乐。主要功能:支持零样本音色控制、风格和节奏对齐,并生成

AI中国 AI中国
221 0
ChatTTSPlus:开源文本转语音工具,支持语音克隆,是 ChatTTS 的扩展版本
学习教程 1年前

ChatTTSPlus:开源文本转语音工具,支持语音克隆,是 ChatTTS 的扩展版本

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!🥦 微信公众号|搜一搜:蚝油菜花 🥦🚀 快速阅读功能:支持语音克隆、TensorRT 加速和移动模型部署。性能:在 Windows 平台上实现了超过 3 倍的加速,处理速度从 28 tokens/s 提升到 110 to

AI中国 AI中国
215 0
Fish Speech 1.5:Fish Audio 推出的零样本语音合成模型,支持13种语言
学习教程 1年前

Fish Speech 1.5:Fish Audio 推出的零样本语音合成模型,支持13种语言

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!🥦 微信公众号|搜一搜:蚝油菜花 🥦🚀 快速阅读多语言支持:支持13种语言,包括英语、日语、韩语和中文。零样本和少样本语音合成:基于10到30秒的声音样本生成高质量语音。无音素依赖:不依赖音素,具有更强的泛化能力。

AI中国 AI中国
252 0
怎么使用提示词进行Ai绘画创作?手把手教你写出AI提示词
学习教程 1年前

怎么使用提示词进行Ai绘画创作?手把手教你写出AI提示词

最近有不少小伙伴说AI绘画提示词写不好,不知道怎么写提示词。那今天我就专门来写写提示词~问什么是提示词首先呢,我们先来深入的了解下什么是提示词?AI 绘画里,提示词就相当于给 AI 下达的 “指令”,它决定了 AI 生成画面的方向、风格、细节等等。就好比盖房子,提示词就是地基,地基打得好,房子才能又稳又好看。如果提示词写得含糊不清,那 AI 生成的画可能就会偏离你的预期,变得乱七八糟,

AI中国 AI中国
262 0
零基础用AI为家乡做宣传片!保姆级教程
学习教程 1年前

零基础用AI为家乡做宣传片!保姆级教程

"不会拍摄不会剪辑?仅靠AI工具让司马迁故里在朋友圈刷屏!从黄河龙门到党家村古建,这套方法论所有县城都能复制..."先看成品工具准备清单小白全家桶(免费)文案生成:DeepSeek(提炼文化关键词)绘画:即梦AI/意间AI(需固定画风参数)配音:剪映AI配音(纪录片男声)剪辑:剪映(自动字幕+蒙版转场)第一步:用DeepSeek生成分镜在DeepSeek生成分镜提示词:我要给陕

AI中国 AI中国
198 0
AI重塑浏览器:下一代互联网入口争夺战打响
学习教程 1年前

AI重塑浏览器:下一代互联网入口争夺战打响

沉寂数年的浏览器大战可能又要战火重启。近期,据海外媒体报道,美国地区法官Leonie Brinkema裁定,Google在广告交易平台和广告服务器(即网站用于出售广告位的工具)这两个市场中违反了反垄断法。美国司法部在法庭文件中主张,Google应为其垄断行为付出严重代价,包括三大核心措施:法院强制出售Chrome浏览器、终止使其搜索引擎在智能手机等设备上获得默认地位的协议、要求向竞争对手提

AI中国 AI中国
280 0
覆盖16省方言的老人语音数据集!SeniorTalk:智源研究院开源全球首个超高龄老年人中文语音数据集
学习教程 1年前

覆盖16省方言的老人语音数据集!SeniorTalk:智源研究院开源全球首个超高龄老年人中文语音数据集

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦🎙️ "75+老人语音识别准确率翻倍!全球首个中文高龄数据集开源,覆盖16省方言"

AI中国 AI中国
256 0
Soundwave:语音对齐黑科技!开源模型秒解翻译问答,听懂情绪波动
学习教程 1年前

Soundwave:语音对齐黑科技!开源模型秒解翻译问答,听懂情绪波动

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦🎙️ 「Siri下岗警告!开源模型把语音翻译误差碾成渣」大家好,我是蚝油菜花。你

AI中国 AI中国
181 0
GPT-4o mini TTS:OpenAI 推出轻量级文本转语音模型!情感操控+白菜价冲击配音圈
学习教程 1年前

GPT-4o mini TTS:OpenAI 推出轻量级文本转语音模型!情感操控+白菜价冲击配音圈

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦🗣️ "声优连夜转行送外卖!OpenAI新模型每分钟语音成本仅9分钱"大家好,我

AI中国 AI中国
252 0
WhisperChain:开源 AI 实时语音转文字工具!自动消噪优化文本,效率翻倍
学习教程 1年前

WhisperChain:开源 AI 实时语音转文字工具!自动消噪优化文本,效率翻倍

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦🎧 “告别手写笔记!WhisperChain 实时语音转文字,自动优化文本,效率翻倍!”大家好,我是蚝油菜花。你是否也遇到过

AI中国 AI中国
283 0
Orpheus TTS:开源语音克隆王炸!200ms延迟+情感操控,Llama3引爆音效革命
学习教程 1年前

Orpheus TTS:开源语音克隆王炸!200ms延迟+情感操控,Llama3引爆音效革命

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦🗣️ "声优界连夜报警!这个开源TTS能克隆任何人声,200ms延迟碾压Siri"

AI中国 AI中国
311 0
TIGER:清华突破性模型让AI「听觉」进化:参数量暴降94%,菜市场都能分离清晰人声
学习教程 1年前

TIGER:清华突破性模型让AI「听觉」进化:参数量暴降94%,菜市场都能分离清晰人声

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!🥦 微信公众号|搜一搜:蚝油菜花 🥦🔊 「你的降噪耳机过时了!清华突破性模型让AI「听觉」进化:参数量暴降94%,菜市场都能分离清晰人声」大家好,我是蚝油菜花。当你在这些场景崩溃时——🚇 地铁电话会议:同事发言总被报站声「

AI中国 AI中国
215 0
Weebo:支持多语言和实时语音交流的开源 AI 聊天机器人,回复具备语调、情感的语音
学习教程 1年前

Weebo:支持多语言和实时语音交流的开源 AI 聊天机器人,回复具备语调、情感的语音

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!🥦 微信公众号|搜一搜:蚝油菜花 🥦🚀 快速阅读功能:支持语音到语音的实时交互,提供自然流畅的对话体验。技术:基于 Whisper Small、Llama 3.2 和 Kokoro-82M 技术,实现

AI中国 AI中国
173 0
TangoFlux:高速生成高质量音频,仅用3.7秒生成长达30秒的音频,支持文本到音频转换
学习教程 1年前

TangoFlux:高速生成高质量音频,仅用3.7秒生成长达30秒的音频,支持文本到音频转换

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!🥦 微信公众号|搜一搜:蚝油菜花 🥦🚀 快速阅读高效生成:TangoFlux 能在3.7秒内生成30秒的高质量音频。文本转换:支持将文本描述直接转换为音频输出。偏好优化:通过CRPO框架优化音频输出,使其更符合用户偏好

AI中国 AI中国
281 0
用AI制作创意姓氏设计跳舞视频,快速实现AI视频变现玩法
学习教程 11月前

用AI制作创意姓氏设计跳舞视频,快速实现AI视频变现玩法

今天给大家拆解一个好玩的创意姓氏设计玩法,这类在小红书或者其它平台上都是很吃香,靠的不是流量,而是定制姓名收费。当然也有很多同学可以直接去直播送礼出名字图。单价可以不用定太高,一杯奶茶进行,你觉得定制用户会少吗?很多拿到会去当头像,或者情侣名字配。变现非常垂直,但是还是要入手要快,姿势要帅,新入局的挣,后入局的卷。今天就给大家分享这种字体玩法,其实做起来很简单,一分钟就能上手。好了,下面就开

AI中国 AI中国
302 0
wan2.1 FLF2V震撼发布:首尾帧精准生成视频!ComfyUI K神+官方双实现教程
视频教程 10月前

wan2.1 FLF2V震撼发布:首尾帧精准生成视频!ComfyUI K神+官方双实现教程

AI中国 AI中国
283 0
十分钟教你如何训练自己的大模型知识库(hugging face|llama|langchain|faiss|google colab)
视频教程 10月前

十分钟教你如何训练自己的大模型知识库(hugging face|llama|langchain|faiss|google colab)

AI中国 AI中国
219 0
DeepSeek+VScode=无敌!本地搭建免费AI代码编辑器,Cursor最佳平替,真的太好用了!小白也能轻松学会!大模型|LLM
视频教程 10月前

DeepSeek+VScode=无敌!本地搭建免费AI代码编辑器,Cursor最佳平替,真的太好用了!小白也能轻松学会!大模型|LLM

AI中国 AI中国
148 0
即梦AI视频制作教程,AI生成视频教程,史上最快AI视频生成软件!
视频教程 9月前

即梦AI视频制作教程,AI生成视频教程,史上最快AI视频生成软件!

AI中国 AI中国
177 0
AI视频制作教程,AI动画电影生成视频教程,即梦AI视频制作教程新手入门
视频教程 1年前

AI视频制作教程,AI动画电影生成视频教程,即梦AI视频制作教程新手入门

AI中国 AI中国
199 0
即梦AI视频制作教程,AI动画电影生成视频教程,即梦AI教程零基础入门
视频教程 1年前

即梦AI视频制作教程,AI动画电影生成视频教程,即梦AI教程零基础入门

AI中国 AI中国
181 0
5分钟教会你开发一个MCP服务
学习教程 1年前

5分钟教会你开发一个MCP服务

之前写过一篇文章讲了MCP的基本概念和技术原理以及如何通过工具配置MCP服务,想了解的小伙伴可以转到这个地址:从入门到实践,一文搞懂MCP到底是啥?附VSCode和Cursor两款编程工具配置指南(保姆级教学),这里就不再赘述了但之前都是使用别人已经开发好的MCP服务,如果你有特殊的业务场景就不一定适用了那么今天就手把手教大家快速开发一个查询天气的MCP服务,这里主要演示下开发大概流程和步骤,

AI中国 AI中国
244 0
AI终于能听懂宝宝说话了!ChildMandarin:智源研究院开源的低幼儿童中文语音数据集,覆盖22省方言
学习教程 1年前

AI终于能听懂宝宝说话了!ChildMandarin:智源研究院开源的低幼儿童中文语音数据集,覆盖22省方言

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦🎙️ "AI终于能听懂宝宝说话了!41小时真实童声数据集开源,覆盖22省方言"大家

AI中国 AI中国
262 0
加载更多

推荐文章

著名 AI 研究者 Yoshua Bengio 创办 LawZero,致力于开发安全的 AI 系统

著名 AI 研究者 Yoshua Bengio 创办 LawZero,致力于开发安全的 AI 系统

11月前 • AI热点
哪种副业真能挣到钱?9种副业真实测试,第5项结果令人意外!

哪种副业真能挣到钱?9种副业真实测试,第5项结果令人意外!

11月前 • 视频教程
速抢(2核2G)77元/年香港免备案服务器

速抢(2核2G)77元/年香港免备案服务器

0秒前 • AI热点
你不需要会演戏 只需会我这操作 随意的替换电影场景中的任何演员

你不需要会演戏 只需会我这操作 随意的替换电影场景中的任何演员

11月前 • 视频教程
当我和豆包一起玩第五...

当我和豆包一起玩第五...

9月前 • 视频教程
苹果研究团队突破AI编程瓶颈:让开源模型自学SwiftUI界面开发

苹果研究团队突破AI编程瓶颈:让开源模型自学SwiftUI界面开发

8月前 • AI热点
红警AI赛场直击:从Prompt工程到API踩坑,看神仙选手如何打造最强指挥官

红警AI赛场直击:从Prompt工程到API踩坑,看神仙选手如何打造最强指挥官

8月前 • AI热点
谷歌开源全栈平台Coral NPU,能让大模型在手表上全天候运行

谷歌开源全栈平台Coral NPU,能让大模型在手表上全天候运行

6月前 • AI热点

热门标签

王者荣耀 音视频一体化模型 家电故障 GPT-4成本 ID 汉诺塔 人工智能影视创作 分享 AI图像设计 文献综述

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝

AI学习站

整合200+开源数据集、50个主流模型API接口、斯坦福等名校课程资源,提供从入门到专家的阶梯式学习导航。

快速链接

  • 首页
  • AI热点
  • AI教程

联系我们

  • gzhcly@qq.com

Copyright © 2026 All rights reserved. AI学习站 黔ICP备2025045649号-2

隐私政策 使用条款 免责声明