AI学习站
首页 AI热点 AI教程
用户头像

标准会员

会员时间

积分 0

历史 通知(0)
首页
AI动态
技术前沿
工具与教程
大模型
AI投资分析
AI落地
AI政策法规

登录账号

忘记密码?

还没有账号? 立即注册

我已阅读并同意用户协议和隐私政策

已有账号? 立即登录

Text to Bark:让狗狗听懂人话!全球首个AI
学习教程 1年前

Text to Bark:让狗狗听懂人话!全球首个AI"狗语"生成器,137种狗狗口音任君挑选

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦🐕 「你家狗子要失业了!这个AI连狗语八级都能伪造,95%的狗狗听不出破绽」大家

AI中国 AI中国
171 0
EmotiVoice:网易开源AI语音合成黑科技,2000+音色情感可控
学习教程 1年前

EmotiVoice:网易开源AI语音合成黑科技,2000+音色情感可控

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦🎙️ "Siri要失业?网易开源语音合成核弹:2000种声线+情绪自由调节,中文效

AI中国 AI中国
294 0
MoshiVis:语音视觉实时交互开源!7B模型秒懂图像,无障碍革命来袭
学习教程 1年前

MoshiVis:语音视觉实时交互开源!7B模型秒懂图像,无障碍革命来袭

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦👁️ 「Siri瞎了20年终于复明!开源模型让语音助手『看见』世界」大家好,我是

AI中国 AI中国
263 0
GPT-4o-Transcribe:OpenAI 推出高性能语音转文本模型!错误率暴降90%+方言通杀,Whisper当场退役
学习教程 1年前

GPT-4o-Transcribe:OpenAI 推出高性能语音转文本模型!错误率暴降90%+方言通杀,Whisper当场退役

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦🎙️ "客服中心集体下岗!OpenAI新核弹每分钟转录成本仅3毛6"大家好,我是

AI中国 AI中国
215 0
Zonos:油管博主集体转粉!开源TTS神器Zonos爆火:克隆你的声音说5国语言,还能调喜怒哀乐
学习教程 1年前

Zonos:油管博主集体转粉!开源TTS神器Zonos爆火:克隆你的声音说5国语言,还能调喜怒哀乐

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!🥦 微信公众号|搜一搜:蚝油菜花 🥦🎬 “百万播放博主秘密武器!开源AI声优Zonos上线:你的声音能说五国方言,悲伤快乐一键切换”大家好,我是蚝油菜花。你是否遇到过——🎧 录中文视频想拓展海外市场,重录多语言版累到声带撕

AI中国 AI中国
248 0
SpeechGPT 2.0:复旦大学开源端到端 AI 实时语音交互模型,实现 200ms 以内延迟的实时交互
学习教程 1年前

SpeechGPT 2.0:复旦大学开源端到端 AI 实时语音交互模型,实现 200ms 以内延迟的实时交互

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!🥦 微信公众号|搜一搜:蚝油菜花 🥦🚀 快速阅读概述:SpeechGPT 2.0 是复旦大学 OpenMOSS 团队推出的端到端实时语音交互模型,基于百万小时级中文语音数据训练,支持情感控制和低延迟响应

AI中国 AI中国
275 0
Kokoro-TTS:超轻量级文本转语音模型,支持生成多种语言和多种语音风格
学习教程 1年前

Kokoro-TTS:超轻量级文本转语音模型,支持生成多种语言和多种语音风格

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!🥦 微信公众号|搜一搜:蚝油菜花 🥦🚀 快速阅读功能:支持多语言、多语音风格生成,具备自然语调和韵律。架构:基于 StyleTTS 2 和 ISTFTNet 的混合架构,纯解码器设计,降低计算复杂度。

AI中国 AI中国
249 0
用Deepseek做中老年情感视频,分分钟学会的AI教程
学习教程 1年前

用Deepseek做中老年情感视频,分分钟学会的AI教程

为什么要做中老年情感视频?在海量的短视频里,中老年情感视频一直是一个被低估但极具潜力的赛道。随着社会老龄化的加剧,中老年人群体对情感内容的需求日益增长。他们渴望被关注、被理解,而中老年情感视频正是满足这一需求的最佳载体。通过AI数字人技术,我们可以轻松制作出高质量、有温度的中老年情感视频,只要打动人心,就能快速获得流量。短视频创作的“流量密码”做短视频,其实方法很简单。核心就是四步:

AI中国 AI中国
361 0
小码王创始人王江有:少儿编程教育进入到“新版本”,必须面向AI重构丨对话
学习教程 1年前

小码王创始人王江有:少儿编程教育进入到“新版本”,必须面向AI重构丨对话

“大道至简,回到常识。”来源|多知作者|王上“当下少儿编程教育已经进入到‘新版本’,必须面向AI重构。”小码王创始人、CEO王江有告诉多知。2016年,AI围棋程序AlphaGo击败韩国围棋九段棋手李世石,王江有创办小码王少儿AI编程,他坚信“AI时代必然到来”。九年后,AI时代已经到来。在此之际,小码王宣布品牌焕新,全面升级为“小码王少儿AI编程”。对于小码王来说,品牌更名不是

AI中国 AI中国
302 0
Clone-voice:开源的声音克隆工具,支持文本转语音或改变声音风格,支持16种语言
学习教程 1年前

Clone-voice:开源的声音克隆工具,支持文本转语音或改变声音风格,支持16种语言

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!🥦 微信公众号|搜一搜:蚝油菜花 🥦🚀 快速阅读功能:支持文字到语音和声音到声音的转换,以及多语言支持。技术:基于coqui.ai的xtts_v2模型,采用Mel-spectrogram进行特征提取。应用:广泛应用于视

AI中国 AI中国
151 0
Baichuan-Audio:端到端音频大模型,实时双语对话+语音生成
学习教程 1年前

Baichuan-Audio:端到端音频大模型,实时双语对话+语音生成

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦🎧 “语音交互新革命!百川智能开源端到端语音模型,实时双语对话轻松搞定”大家好,我是蚝油菜花。你是否也遇到过——👉 语音

AI中国 AI中国
278 0
Hibiki:实时语音翻译模型打破语言交流障碍!支持将语音实时翻译成其他语言的语音或文本
学习教程 1年前

Hibiki:实时语音翻译模型打破语言交流障碍!支持将语音实时翻译成其他语言的语音或文本

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!🥦 微信公众号|搜一搜:蚝油菜花 🥦大家好,我是蚝油菜花,今天跟大家分享一下 Hibiki 这个开源的实时语音翻译模型,能够将一种语言的语音实时翻译成另一种语言的语音或文本。🚀 快速阅读Hibiki 是一个用于实时语音翻译的

AI中国 AI中国
235 0
百聆:集成Deepseek API及语音技术的开源AI语音对话助手,实时交互延迟低至800ms
学习教程 1年前

百聆:集成Deepseek API及语音技术的开源AI语音对话助手,实时交互延迟低至800ms

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!🥦 微信公众号|搜一搜:蚝油菜花 🥦🚀 快速阅读技术核心:百聆结合语音识别(ASR)、语音活动检测(VAD)、大语言模型(LLM)和语音合成(TTS)技术,实现高效语音对话。功能亮点:支持语音输入、智

AI中国 AI中国
261 0
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
学习教程 1年前

3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!🥦 微信公众号|搜一搜:蚝油菜花 🥦🚀 快速阅读功能:支持说话人日志、说话人识别、语种识别、多模态识别和重叠说话人检测。技术:结合声学、语义和视觉信息,采用EEND网络和无监督聚类技术。应用:适用于会议记录、法庭记录、

AI中国 AI中国
609 0
Ai制作口播视频,用星流AI+剪映免费制作3D卡通动漫数字人口播形象
学习教程 1年前

Ai制作口播视频,用星流AI+剪映免费制作3D卡通动漫数字人口播形象

最近,有同学在问,有没有什么可以制作自己的数字人形象,对口型时还不受时长的限制,我可以一直去说话。剪映太贵,第三方也是充值,免费的用起来也有很多问题。能不能有个简单的办法,答案肯定是有的。好了,下面就开始进入实操,建议一定保存好了。这里面需要使用上的AI工具:1.生图工具:星流AI2.视频工具:可灵AI3.剪辑工具:剪映首先,我们想要生成一个符合自己的形象人物。这里给大家准备一个练

AI中国 AI中国
314 0
AI自己当CEO,开发一个精美网站仅需9分钟
学习教程 1年前

AI自己当CEO,开发一个精美网站仅需9分钟

很多同学可能都熟悉得到这家公司的创业历史。当年罗胖和脱不花想在微信上卖书,但很快发现还得搭一个网站。对他们俩来说,虽然很清楚自己想做什么,但因为不是做产品和技术出身的,所以完全不知道该怎么下手。也正是因为这个看起来挺棘手的问题,我在10多年前跟他们一起开始了创业。不过,作为一个产品经理出身的人来说,很多事情也必须依赖专业人士的配合,例如前端工程师、后端工程师、测试、设计师、客户端工程师等等。

AI中国 AI中国
254 0
Cursor 项目研发最佳实践总结
学习教程 1年前

Cursor 项目研发最佳实践总结

如何充分发挥 Cursor 的潜力,在经过多个项目的实践之后,通过系统化地应用Cursor的各项功能,总结了一套Cursor的最佳使用方法。无论你是刚开始接触Cursor的新手,还是希望深化使用的老手,这些方法都能帮助你和你的团队更好地驾驭这一强大工具,在保证代码质量的同时,有效提升开发效率。一、项目启动:规划与基础构建1. 开发前的全面规划开始一个新项目时,我们往往急于写代码,却忽略了前期规

AI中国 AI中国
311 0
Python文本可视化:词云图
学习教程 1年前

Python文本可视化:词云图

一、什么是词云图DeepSeek-CJK-patch, Inter, system-ui, -apple-system, BlinkMacSystemFont, "Segoe UI", Roboto, "Noto Sans", Ubuntu, Cantarell, "Helvetica Neue", Oxygen, "Open Sans", sans-serif;font-size: 16.0

AI中国 AI中国
288 0
忙了仨月,我们希望让教育更平权一点
学习教程 1年前

忙了仨月,我们希望让教育更平权一点

我成长于一个典型的中国式家庭,从小学到大学,努力读书与应试,在每个阶段尽量跳起来够到所能触及的最好教育资源。而由于好资源的稀缺,使得求学的过程具有很强的竞技属性。就我自己而言,努力学习,一半是功利一半是兴趣。互联网在过去二十年间的大规模普及,从根本上重塑了人类获取信息的方式,这种变革如此深刻而广泛,以至于其革命性意义常常因其无处不在的特性而被大家所忽视。可以说,互联网已经基本解决了信息匮乏的问

AI中国 AI中国
241 0
【MCP黑科技】AI工具连携作战指南:一个指令全自动搞定!
学习教程 1年前

【MCP黑科技】AI工具连携作战指南:一个指令全自动搞定!

当我第一次听说MCP时... "哈又来一个装X缩写词"(内心疯狂翻白眼.jpg)但当我发现这玩意儿简直是AI界的万能转换头?——就像手机笔记本通用的USB-C接口一样——我直接跪了!再也不用被各种限定环境的插件和复杂脚本折磨到秃头了...MCP让我秒变AI装备大师 现在我能像搭乐高一样,咔咔几下就组装出自己的AI复仇者联盟!这篇就带大家看看我怎么在:ClineWindSurf偶尔宠幸的Curs

AI中国 AI中国
228 0
AI视频变现项目,用DeepSeek+即梦AI打造爆款哲学语录视频
学习教程 11月前

AI视频变现项目,用DeepSeek+即梦AI打造爆款哲学语录视频

今天给大家带来一个超简单的短视频玩法,只需两步就能制作出点赞量高达60万+的哲学语录视频,而且这个赛道变现能力非常强,很适合普通去做。为什么选择哲学语录视频?先给大家看一个案例。这是抖音上一条哲学语录视频,短短10秒的内容,却获得了60万+的点赞,播放量至少100万+。这类视频不仅在抖音火爆,在快手、视频号、某红薯等平台同样受欢迎。这种视频属于文案号赛道,吸引的粉丝群体变现价值很高,可以

AI中国 AI中国
272 0
AI一键生成穿越各种场景镜头,快速打卡世界各地景点短视频教程
学习教程 1年前

AI一键生成穿越各种场景镜头,快速打卡世界各地景点短视频教程

今天给大家拆解一个好玩的提示词特殊功能玩法,直接穿越各种场景,连贯性非常强,用来打卡各景区或者各场景的穿越过渡是非常不错效果,动感十足创意点也不错。学会了还能利用到各种大片里面。 好了,下面就开始进入实操,建议一定保存好了。 这里面需要使用上的AI工具: 1.生图工具:即梦AI 2.视频工具:viduAI 3.剪辑工具:剪映 第一步:景点或者建筑物的提示词 景点和建筑这类,不需要我们特别去写,我

AI中国 AI中国
274 0
来自cursor团队的12条AI编程技巧。
学习教程 1年前

来自cursor团队的12条AI编程技巧。

昨天 Cursor 的首席设计师 Ryo Lu(之前在 Notion 也是首席设计师)分享了他对如何用好AI编程的看法。无独有偶,归藏老师昨天也总结了一套实战心法。简单来说,用好 AI 编程助手的关键,在于结构清晰、心里有数,把它当作一个**需要引导和协作的伙伴 (Agent)**,而不是一个会读心术的魔术师~很多人一开始就跑偏了,总想着给 AI 一个模糊的想法,然后期待它能“哐”一下变出完美

AI中国 AI中国
250 0
用AI把产品讲清楚:这是我真正需要的工具
学习教程 1年前

用AI把产品讲清楚:这是我真正需要的工具

过去一段时间,我一直在研究小红书数据分析与跨境电商运营工具的方向,同时动手开发了一些用于辅助内容创作、用户分析和运营决策的小工具。这些工具起初是为了解决自己在实际工作中遇到的问题,比如如何用AI去高效分析评论内容、如何识别优质博主特征、如何提炼出爆款内容背后的要素等。随着功能逐渐积累,我意识到它们已经可以形成一个系统化的产品工具集。如何“讲清楚”我在做什么?工具之外,还需要叙述能力功能型的工具

AI中国 AI中国
287 0
秘塔AI‘私人定制AI讲师’上线,这类老师危危危了
学习教程 1年前

秘塔AI‘私人定制AI讲师’上线,这类老师危危危了

前两天,知乎有个热门问题,讨论‘大学生吐槽大学老师水课’的问题。有位网友的吐槽,获得了众多点赞:““七十年代的人拿着八十年代的教材用着九十年代的技术教00后如何解决二十世纪出现的问题并且在现在找工作”。”传统教育跟不上社会发展的问题,早不是一天两天了。但让他们想不到的是,也许有一天,颠覆他们‘铁饭碗’的不是某项改革,而是AI技术。秘塔AI打响“教育平权”的第一枪。支持将网页、本地文档、平台资料

AI中国 AI中国
293 0
5分钟用AI搞定小红书灵感选题
学习教程 1年前

5分钟用AI搞定小红书灵感选题

Hi,我是银海。你身边的AI产品经理,陪你解决每一个真实问题。还记得我们上篇文章聊到AI应用中的 MCP 吗?在上篇文章中我们也提到的基于现有的 MCP 去做出一些有趣的应用的思路,用一句话来概括就是:让大模型辅助你去做头脑风暴并给出一些贴合实际应用场景的案例。可以回顾这篇文章:距离有趣的MCP应用,你还缺这个方法。在当时就做了一些比较有意思的实践案例,将 MCP 的能力重新排

AI中国 AI中国
191 0
学习教程 1年前

HumanRig – 阿里高德推出的3D人形角色自动绑定任务数据集

HumanRig是什么HumanRig 是阿里巴巴团队开发的 3D 人形角色自动绑定研究项目。解决现有绑定技术因缺乏高质量数据集而发展受限的问题,通过提供大规模、高质量的数据集和创新的自动绑定框架,推动 3D 角色动画制作的自动化发展。 HumanRig 数据集包含 11434 个 T 姿态网格,遵循统一骨骼拓扑结构,具有多样化头部与身体比例,填补了现有数据集在规模、多样性和骨骼一致性方面的空

AI中国 AI中国
172 0
学习教程 1年前

MAI-DS-R1 – 微软开源的 AI 模型,基于 DeepSeek R1 改进版

MAI-DS-R1是什么MAI-DS-R1 是微软基于 DeepSeek R1 改进的AI模型。MAI-DS-R1基于后训练优化,支持响应 99.3% 的敏感话题提示,比原版提升 2 倍,将有害内容风险降低 50%。MAI-DS-R1 在推理能力上保持与 DeepSeek R1 相同的水平,支持多语言回答,适用于国际组织、跨国企业和教育机构等多语言环境。MAI-DS-R1已开源,供研究人员和开

AI中国 AI中国
252 0
学习教程 1年前

FramePack – 斯坦福开源的视频生成技术

FramePack是什么FramePack 是斯坦福大学推出用在视频生成的技术。基于压缩输入帧的上下文长度,解决视频生成中的“遗忘”和“漂移”问题,让模型能高效处理大量帧,保持较低的计算复杂度。FramePack 仅需 6GB 显存在普通笔记本电脑上运行,支持实时生成高清视频,基于抗漂移采样技术保证视频稳定性和连贯性。FramePack提供灵活的调度策略,适用于多种应用场景,降低 AI 视频生

AI中国 AI中国
246 0
学习教程 1年前

FastAPI-MCP – 一键将 FastAPI 转换为 MCP 服务器的开源工具

FastAPI-MCP是什么FastAPI-MCP 是将 FastAPI 应用的端点自动转换为符合模型上下文协议(MCP)的开源工具。具有零配置的特点,只需简单指向 FastAPI 应用可自动发现并转换所有端点为 MCP 工具,无需额外设置。通过保留 FastAPI 的请求和响应模型模式以及 Swagger 文档,FastAPI-MCP 确保了接口的完整性和易用性。 工具支持直接集成到 Fas

AI中国 AI中国
306 0
加载更多

推荐文章

AI日报:国内首个多模态AI程序员上岗;字节启动Top Seed计划招募AI人才;DeepSeek R1T Chimera上线OpenRouter

AI日报:国内首个多模态AI程序员上岗;字节启动Top Seed计划招募AI人才;DeepSeek R1T Chimera上线OpenRouter

1年前 • AI热点
号称可以生成录音室级别人声音乐,Eleven Music 文字转音频 AI 模型问世

号称可以生成录音室级别人声音乐,Eleven Music 文字转音频 AI 模型问世

8月前 • AI热点
速抢(2核2G)77元/年香港免备案服务器

速抢(2核2G)77元/年香港免备案服务器

0秒前 • AI热点
手把手教你用AI制作养生视频教程,用deepseek打造爆款短视频

手把手教你用AI制作养生视频教程,用deepseek打造爆款短视频

11月前 • 学习教程
缺乏AI领导力,任何AI项目都将沦为昙花一现的试验品

缺乏AI领导力,任何AI项目都将沦为昙花一现的试验品

10月前 • 图文教程
Contextual AI:从幻觉到可信,钻研RAG架构解决企业级AI应用落地最大痛点

Contextual AI:从幻觉到可信,钻研RAG架构解决企业级AI应用落地最大痛点

9月前 • AI热点
王菲各动态专辑封面,ai可灵生成

王菲各动态专辑封面,ai可灵生成

11月前 • 视频教程
蓝桥杯大赛处理 1133 名作弊选手,“AI + 人工”双重监考

蓝桥杯大赛处理 1133 名作弊选手,“AI + 人工”双重监考

12月前 • AI热点

热门标签

品牌产品词:Creatify 最高法院 美女 音频概述 4K叙事高清视频 订阅套餐 大学 人工智能芯片 AI内容创作 青少年保护

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝

AI学习站

整合200+开源数据集、50个主流模型API接口、斯坦福等名校课程资源,提供从入门到专家的阶梯式学习导航。

快速链接

  • 首页
  • AI热点
  • AI教程

联系我们

  • gzhcly@qq.com

Copyright © 2026 All rights reserved. AI学习站 黔ICP备2025045649号-2

隐私政策 使用条款 免责声明