求问佬友,电脑端有没有类似于豆包输入法一样低延迟准确的语音识别方案

RT,豆包输入法还是太爽了,现在完全不想打字,想在PC端也整一个

4 个赞

试试,但是非开源

1 个赞

typeless

这个刚试了一下,挺好用的

pc还是豆包

1 个赞

看起来还不错,下了试试,有AI优化挺好的。

我现在用的离线的本地语音识别的也用的是差不多的模型,有佬打包成这个了,开源的,用了两三年了。我原本想自己加一个优化,但是感觉不是所有的都需要优化,直接硬加上去太重型了,就没加。刚刚看到了这两天原作者突然给它加上了LLM优化(震撼),建议试用:GitHub - HaujetZhao/CapsWriter-Offline: CapsWriter 的离线版,一个好用的 PC 端的语音输入工具,支持热词、LLM处理。


进一步试用了一下闪电说,除了AI优化部分,大部分功能都是直接抄的CapsWriter-Offline,但是有以下几个无法忍受的问题(感觉是没抄明白):

  1. 语音识别模型下的是中文模型,我原本用的CapsWriter-Offline好歹支持中英双语
  2. 词典识别里面不区分中英文词典
  3. 录音文件直接自动保留为wav文件,并且不提供关闭文件保存的功能,甚至无法修改文件的存储路径,十分占用空间。我原本用的CapsWriter-Offline因为是开源的我自己手动把它的wav保存给ban了。
  4. 识别效果不如CapsWriter-Offline
  5. 词典缺乏正则规则替换。原本的CapsWriter-Offline支持自行增加正则替换,常用输入语很方便,比如我写了个哈基米=Gemini……
  6. 标点添加没有豆包输入法智能,效果也不如CapsWriter-Offline
  7. 设置为单个按键输入的时候,没区分短按还是长按。比如我习惯用长按CapsLock输入,CapsWriter-Offline支持短按的时候大小写切换依旧起效,但是闪电说就不行了它只能语音输入。
  8. 以上问题我会直接反馈到闪电说开发团队那边。orz我现在还是继续用CapsWriter-Offline吧。
1 个赞

这个是挺方便的,本地的模型不是很大,足够满足日常需求

插个眼,等一个成熟方案摘桃子哈哈哈哈哈

之前论坛有佬分享过,通过手机豆包 输入到pc的方案

电脑端ai语音输入我只推荐闪电说

智普的AutoGLM输入法效果挺好的,现在免费开放了,似乎承诺永久免费,用起来基本可以实现豆包输入法的程度,比闪电说要更准确一些,而且是在线识别,没有本地音频占用的问题,也支持常见的中英混合输入等需求。

1 个赞