Transcribe 是一个基于 OpenAl 训练并开源的录音转文字工具,支持英语、中文等多种语言,最大的优点就是无需下载大型的模型文件。
ai Transcribe功能:
1、音频转录文字
快速把会议记录转录成生成会议纪要,把课堂录音转录成课堂记录,消除了手动记笔记的需要,可以节省时间,提高生产力。
2、视频字幕制作
支持多种常见的视频格式,可以快速地把视频转录成字幕,提高制作字幕的效率。无需互联网连接,不需要上传视频,:不需要担心视频泄露。
3、播客转文字
把播客转写成文字,打破播客“线性”时间的限制,加速从播客中获取信息,使播客变成得可以搜索,成为重要的信息来源。
使用 Transcribe 进行语音转文字非常简单,只需要输入 OpenAl API key,然后选择音频文件进行转换。它支持文本、.srt、.vtt 三种格式,转换成功之后,将内容复制,放到文本编辑器中,保存为 srt,完成了语音转文字的任务。
ChatTTS,一个专门用于对话场景的免费在线文本转语音TTS模型,适用于自然、对话式文本转语音。它支持英文和中文两种语言。这个语音专文本TTS模型 应该是目前对中文支持最好的了,ChatTTS模型经过超过10万小时的训练,公开版本在 HuggingFace 上提供了一个4万小时预训练的模型。它专为对话任务优化,能够支持多种说话人语音,中英文混合等。