搜索了 论坛没有 语音转文字大家有什么 好办法?

语音转文字大家有什么 好办法?

mp3格式的 起码俩小时

剪映 必剪 一类的 不是收费 就是各种 不花钱不给办系列

在线的也大部分限制 文件大小 和时长

AI时代了 就没啥办法么?

离线大语言模型? whisper buzz?

谢谢大家

:slight_smile:

3 个赞

Google AI Studio (GCP 有专门转录语音的,AI Studio 也是调用自家的接口)

这个嘞

真的吗,我不信
【开源】重复造轮子但 cf pages 【加个tts】

通义听悟可以试试,单文件最多支持6小时

通义听悟 YYDS

PotPlayer自带的whisper就可以啊,直接生成字幕 :rofl:

非常感谢 试试去

找个开源的或者免费的asr

asr 是什么呢?

可以用开源的语音识别模型, 你是要识别 中文 还是英文 还是中英文结合 有其他语音吗,是要一次性识别2个小时 可以分段识别吗

就是普通的会议记录 中文的 buzz效果不太好哇

飞书呗,自己搞个飞书账号,用它的飞书妙记哇

刚打算试用一阵 飞书的骚扰电话这就来了 服了 劝升级商业版

大部分的口语应该是能识别的 就是专业领域的 估计不太能识别出来

开源推荐whisper large,几年没更新了,还是小模型
闭源就google,不过这个貌似没有时间轴

本地的我记得阿里有FunASR啊,那个也还可以