比较火的 AI 拟声项目,它能在 5 秒内克隆你的声音并生成任意语音内容,支持中文普通话拟声,并且在多个中文数据集进行了测试,支持在 Windows、Linux、Mac 操作系统使用,基于 B/S 架构交互,简单收集声音,生成拟声。
特性
🌍 中文 支持普通话并使用多种中文数据集进行测试:aidatatang_200zh, magicdata, aishell3, biaobei, MozillaCommonVoice, data_aishell 等
🤩 PyTorch 适用于 pytorch,已在 1.9.0 版本(最新于 2021 年 8 月)中测试,GPU Tesla T4 和 GTX 2060
🌍 Windows + Linux 可在 Windows 操作系统和 linux 操作系统中运行(苹果系统M1版也有社区成功运行案例)
🤩 Easy & Awesome 仅需下载或新训练合成器(synthesizer)就有良好效果,复用预训练的编码器/声码器,或实时的HiFi-GAN作为vocoder
🌍 Webserver Ready 可伺服你的训练结果,供远程调用
部署教程
按说明把 Python 环境、PyTorch、多媒体处理组件 FFmpeg 装好,剩下的就用把依赖库都装了,就差不多完成了。
部署成功后,可以在浏览器访问 8080 端口来体验 Mocking Bird。
切记关于AI东西的都是需要显卡的,想要流程使用的建议显卡好一点
© 版权声明
THE END
暂无评论内容