语音转文字大家有什么 好办法?
mp3格式的 起码俩小时
剪映 必剪 一类的 不是收费 就是各种 不花钱不给办系列
在线的也大部分限制 文件大小 和时长
AI时代了 就没啥办法么?
离线大语言模型? whisper buzz?
谢谢大家
![]()
语音转文字大家有什么 好办法?
mp3格式的 起码俩小时
剪映 必剪 一类的 不是收费 就是各种 不花钱不给办系列
在线的也大部分限制 文件大小 和时长
AI时代了 就没啥办法么?
离线大语言模型? whisper buzz?
谢谢大家
![]()
Google AI Studio (GCP 有专门转录语音的,AI Studio 也是调用自家的接口)
这个嘞
真的吗,我不信
【开源】重复造轮子但 cf pages 【加个tts】
通义听悟可以试试,单文件最多支持6小时
通义听悟 YYDS
PotPlayer自带的whisper就可以啊,直接生成字幕 ![]()
非常感谢 试试去
找个开源的或者免费的asr
asr 是什么呢?
可以用开源的语音识别模型, 你是要识别 中文 还是英文 还是中英文结合 有其他语音吗,是要一次性识别2个小时 可以分段识别吗
就是普通的会议记录 中文的 buzz效果不太好哇
飞书呗,自己搞个飞书账号,用它的飞书妙记哇
刚打算试用一阵 飞书的骚扰电话这就来了 服了 劝升级商业版
大部分的口语应该是能识别的 就是专业领域的 估计不太能识别出来
开源推荐whisper large,几年没更新了,还是小模型
闭源就google,不过这个貌似没有时间轴
本地的我记得阿里有FunASR啊,那个也还可以