【开源】按住说话-Windows平台语音输入转文本小工具（5MB）（qwen-asr-flash/doubao驱动，支持自定义润色）

yyyzl · 2025 年12 月 10 日 16:12

源码地址

欢迎大家试用反馈，觉得有用的话，欢迎点个。

简介

按住按键说话，会将你所说的内容，自动粘贴到当前光标位置。

支持qwen/doubao ASR，响应速度极快，基本上0.4-0.8s内准确率高
支持自定义后置模型润色

ASR KEY申请

https://ncn18msloi7t.feishu.cn/wiki/ZnBZwSNjpisUdYkKks1cbes8nGb?from=from_copylink

润色模型推荐

https://ncn18msloi7t.feishu.cn/wiki/UJiWwpGmUio1jYkxJPHc4xu2n8c

功能介绍

支持实时流式转录/HTTP转录 - 支持 WebSocket 边录边传，极低延迟，松手即出字。
LLM 智能后处理 - 内置 “文本润色”、“邮件整理”、“中译英” 等预设，支持自定义 Prompt
支持智能指令模式 - 按住向AI提问/选中内容提问
支持松手模式 - 按下后持续录音，无需久按
全局自定义快捷键 - 支持配置自己想要的录音快捷键
音频反馈 - 录音开始/结束时的清脆提示音，盲操也放心
弹窗反馈 - 录音开始/结束时界面上清晰的弹窗展示
双模引擎 & 自动备选 - 默认主ASR，并支持 SiliconFlow (SenseVoice) 作为备用渠道。

界面展示

更新日志

v0.0.15

支持松手模式
支持智能指令模式&优化前端界面&优化自动更新功能

v0.0.12
feat：支持自定义按键&支持豆包使用硅基流动兜底

v0.0.9
chroe：优化开启自启动和更新界面展示

v0.0.8
update：优化热键检测能力，引入看门狗机制

v0.0.6
feat：支持自动更新&优化提示音

v0.0.4
feat：支持开机自启动

v0.0.3
feat：重构API填写界面&支持豆包ASR
feat：支持语音状态弹窗

v0.0.2
feat：新增最小化到托盘功能

v0.0.1
feat：mvp版本

PLA81 · 2025 年12 月 10 日 16:39

感谢分享

Flail7127 · 2025 年12 月 10 日 16:41

发的时间有些阴间了，可以明天上午发

yyyzl · 2025 年12 月 10 日 16:42

明早再更新一次哈哈哈哈

AsherL1n · 2025 年12 月 10 日 16:58

插个书签，早上睡醒了来看一下，早就看win11的语音输入不爽了

yyyzl · 2025 年12 月 10 日 17:10

谢谢佬的支持

stou · 2025 年12 月 10 日 23:30

佬反馈个问题,在关闭服务的情况下在输入框按住Ctrl加win键会自动变为开启服务状态并提示没有录制到音频数据,而且无法关闭服务状态,点击停止服务会提示服务未运行,只能关掉程序重新打开

EDWINCHENC · 2025 年12 月 10 日 23:45

不错，晚点就试试。是Qwen3 ASR吗？
考虑支持下豆包的语音识别2.0吗

handsome · 2025 年12 月 11 日 00:47

感谢大佬

F-droid · 2025 年12 月 11 日 01:04

支持 @yeahhe 佬的Qwen3 ASR API吗？

yyyzl · 2025 年12 月 11 日 01:56

可以考虑，这个出了的时候对比了一下，没看到有明显的优势，所以没新增，今天考虑支持上去

yyyzl · 2025 年12 月 11 日 01:56

这个可以考虑，等我研究下佬的

yyyzl · 2025 年12 月 11 日 01:57

收到！这个情况我下班回去复现一下，修复了踢你一下

EDWINCHENC · 2025 年12 月 11 日 02:24

豆包的asR直是第一梯队的，尤其是前几天刚发布了语音识别模型的2.0版本，跟Qwen3-asr应该是不相上下。

EDWINCHENC · 2025 年12 月 11 日 02:30

测试了一下效果不错但是它好像没法自动添加标点符号。
另外建议复制过程中增加一个桌面的动效。
还有就是能不能关闭后能最小化到系统托盘，保持在后台激活状态

yyyzl · 2025 年12 月 11 日 03:35

是的，前几天发布的时候我就了解了一下，当时用Grok比较了一下，Grok告诉我推荐继续qwen哈哈哈哈，我回去加一下吧，加好了踢你

yyyzl · 2025 年12 月 11 日 03:36

这个应该是千问ASR的问题，你可以让后置的优化模型帮你智能区分，推荐智谱的glm4 flash速度特别快，还免费

ynianshuangjiang · 2025 年12 月 11 日 03:40

感谢分享，研究一下

EDWINCHENC · 2025 年12 月 11 日 03:48

感谢大佬~~好项目

BD2025 · 2025 年12 月 11 日 04:43

用上啦，感谢

话题		回复	浏览量
言犀键盘-基于成熟AI ASR API 的智能语音输入法资源荟萃人工智能 , 软件开发	296	3443	2025 年12 月 22 日
:fire:【原创长文】深度分析AI语音输入法CleverType，如何降维打击讯飞搜狗语音，成为你的效率利器【长期更新】文档共建 ChatGPT , OpenAI , 人工智能 , 纯水 , 原创	29	1939	2025 年9 月 15 日
用了 Spokenly 之后，我再也不想用其他 Mac 语音转文字应用了。。开发调优人工智能	94	2748	2026 年1 月 28 日
推薦和順便吐槽一下 WIN上能用的語音輸入开发调优软件开发	17	286	2025 年10 月 24 日
言犀键盘船新版本!!带着本地 ASR 模型和一大堆更新优化来了资源荟萃人工智能 , 软件开发 , 纯水	120	1594	2026 年1 月 28 日