10分钟提取100分钟的日语视频音频为字幕用colab 不需要好显卡拒绝复读机

johnwick · 2025 年11 月 26 日 05:27

日语小姐姐特供版

这是一个免费的日语音声转录工具，可以把日语音频（MP3、WAV 等）自动转换成文字和字幕。

核心特点：

折腾了好几天
主要是解决了大量语气词拟声词环境下的语音转录复读机bug 主要是调整vad来解决
目前过于严格会漏掉某些正常对话

觉得有用的可以点个赞
大家需要的话再发点类似内容
日语字幕转中文这个大家有好的方法吗？

笔记本代码和指南在附件

BunnySupermarket · 2025 年11 月 26 日 05:28

这是可以用来做我想的那个字幕的嘛

superuser · 2025 年11 月 26 日 05:29

本意就是用于想的那个字幕

zhang_l · 2025 年11 月 26 日 05:30

如果能从视频转成字幕会更有吸引力，嘿嘿

johnwick · 2025 年11 月 26 日 05:30

主要是解决了大量语气词拟声词环境下的语音转录复读机bug

DisplayKing · 2025 年11 月 26 日 05:31

那个不用想动作就是字幕

vfrcde2001 · 2025 年11 月 26 日 05:31

用的whisper模型？

BunnySupermarket · 2025 年11 月 26 日 05:32

手动分离一下音频就行了也不是很麻烦

johnwick · 2025 年11 月 26 日 05:33

对大家有好方案可以讨论造福人民~

ziyuxingyuan · 2025 年11 月 26 日 05:33

Large-V3-Turbo模型的幻觉太强了，感觉还不如V2的好。我现在在用Nvidia的Parakeet语音识别大模型，能支持日文，而且基本上没有幻觉

BunnySupermarket · 2025 年11 月 26 日 05:34

佬你简直是一流产品经理

johnwick · 2025 年11 月 26 日 05:34

有说v2比v3好的不过这个我测试基本没问题了佬说的有可用的代码吗

ziyuxingyuan · 2025 年11 月 26 日 05:35

我看了下你的文档，说的用的deepdml 社区版V3，可能专门优化过这个问题。我试试

gahuuuuje · 2025 年11 月 26 日 05:35

大佬，有英文版的吗？

johnwick · 2025 年11 月 26 日 05:36

英文应该更简单吧

gahuuuuje · 2025 年11 月 26 日 05:39

英文虽然简单，可我还是听不懂。。。

user717 · 2025 年11 月 26 日 05:41

电脑能运行吗? 我谷歌运行进去是代码界面

user717 · 2025 年11 月 26 日 05:42

yeluo001 · 2025 年11 月 26 日 05:46

没看懂怎么用呢，notebook里面加载不了这个文件，直接浏览器打开就变成内容预览了

johnwick · 2025 年11 月 26 日 05:46

打开 Google Colab：https://colab.research.google.com
用你的 Google 账号登录
点击"文件" → “上传笔记本”
选择 纯净版带缓存_Large-V3-Turbo极速版.ipynb 文件上传
上传后点击右上角"连接"按钮，选择 T4 GPU

话题		回复	浏览量
搜索了论坛没有语音转文字大家有什么好办法? 搞七捻三人工智能 , 快问快答	17	624	2025 年9 月 9 日
有没有适合制作日语语音转录字幕的工具？开发调优人工智能 , 快问快答	61	1276	2025 年5 月 26 日
晚上看片没翻译，自己攒了一个屏幕区域实时翻译开发调优 NSFW , 纯水	108	4136	2025 年11 月 12 日
【卡卡字幕助手】VideoCaptioner - 基于 LLM 的智能字幕助手，支持生成、断句、优化、翻译、视频合成全流程！资源荟萃 ChatGPT , OpenAI , GitHub , 软件开发	110	5820	2025 年11 月 3 日
给年会祝福视频进行语音识别（英语）、加字幕，有什么快捷好用的工具？【已附总结】搞七捻三快问快答	24	347	2026 年3 月 17 日

10分钟提取100分钟的日语视频音频为字幕 用colab 不需要好显卡 拒绝复读机