音频转文字和通过文字生成ai配音解决方案

2023-12-26  本文已影响0人  listems

Buzz 是一款基于 OpenAI Whisper 的开源、可离线的实时语音转文字工具

Whisper是一种通用语音识别模型。

最好挂着vpn吧,需要登录GitHub还有那个模型是国外的。

我不太确定下载Buzz之前一定要下载像python3.10和FFmpeg 。先下载Buzz试试吧,不行的话再配置那个Whisper吧,用模型的时候先用精度比较低的,精度越高的貌似吃内存,电脑会突然变卡。Buzz不支持mp4格式,我测试的时候在转换成wav格式。具体详细的步骤第二篇参考文章都有介绍

Buzz下载地址

b站上那个图像界面软件用不了,就暂时用那个在线网站代替了,貌似都是白嫖的微软的模型

在线文本转语音工具

Reference

上一篇下一篇

猜你喜欢

热点阅读