搜索了论坛没有语音转文字大家有什么好办法?

cybermay · 2025 年7 月 31 日 08:31

语音转文字大家有什么好办法?

mp3格式的起码俩小时

剪映必剪一类的不是收费就是各种不花钱不给办系列

在线的也大部分限制文件大小和时长

AI时代了就没啥办法么?

离线大语言模型? whisper buzz?

谢谢大家

Qiner · 2025 年7 月 31 日 08:38

Google AI Studio （GCP 有专门转录语音的，AI Studio 也是调用自家的接口）

xiaozhang959 · 2025 年7 月 31 日 08:39

这个嘞

Bing08 · 2025 年7 月 31 日 08:52

dwadmin · 2025 年7 月 31 日 08:54

通义听悟可以试试，单文件最多支持6小时

fengchris · 2025 年7 月 31 日 08:57

通义听悟 YYDS

iriyalnx · 2025 年7 月 31 日 09:02

PotPlayer自带的whisper就可以啊，直接生成字幕

cybermay · 2025 年8 月 1 日 02:08

非常感谢试试去

mrhe_aquarius · 2025 年8 月 1 日 02:15

找个开源的或者免费的asr

cybermay · 2025 年8 月 2 日 06:08

asr 是什么呢?

aijin · 2025 年8 月 3 日 05:29

可以用开源的语音识别模型，你是要识别中文还是英文还是中英文结合有其他语音吗，是要一次性识别2个小时可以分段识别吗

cybermay · 2025 年8 月 4 日 03:45

就是普通的会议记录中文的 buzz效果不太好哇

Jerk_H · 2025 年8 月 4 日 03:47

飞书呗，自己搞个飞书账号，用它的飞书妙记哇

cybermay · 2025 年8 月 4 日 03:54

刚打算试用一阵飞书的骚扰电话这就来了服了劝升级商业版

aijin · 2025 年8 月 4 日 09:02

大部分的口语应该是能识别的就是专业领域的估计不太能识别出来

Houyinx · 2025 年8 月 4 日 09:14

acips · 2025 年8 月 4 日 09:17

开源推荐whisper large，几年没更新了，还是小模型
闭源就google，不过这个貌似没有时间轴

qi_xing_jk · 2025 年9 月 9 日 17:10

本地的我记得阿里有FunASR啊，那个也还可以

话题		回复	浏览量
⚡️ 求推荐免费的语音识别 ASR 开发调优快问快答 , 软件开发	19	495	2025 年8 月 22 日
想问下佬，有没有 free 的语音转文字工具？搞七捻三软件开发 , 求资源	33	626	2025 年8 月 1 日
10分钟提取100分钟的日语视频音频为字幕用colab 不需要好显卡拒绝复读机开发调优 NSFW , 人工智能 , 影视	53	1073	2025 年11 月 28 日
有哪里可以白嫖语音转文本服务吗？搞七捻三人工智能 , 快问快答	32	1813	2024 年12 月 6 日
佬友们有没有识别语音转文字的软件推荐资源荟萃人工智能	32	1153	2026 年3 月 25 日

搜索了 论坛没有 语音转文字大家有什么 好办法?