测试发现豆包输入法同时使用流式和文件语音识别

yeahhe · 2026 年2 月 5 日 12:22

文件识别效果,对网络热词处理比较好

流式识别效果

豆包输入法流式显示文字的时候，用的是流式识别
点击结束后的最终文字，就对应文件识别的效果

所以调用豆包API的时候，如果要达到豆包输入法的效果，就需要用到文件语音识别API

xiaoxiann · 2026 年2 月 5 日 12:26

墨子佬最近很执着豆包啊

zzgreg · 2026 年2 月 5 日 12:31

意思是可以用豆包API复刻出豆包输入法的语音转文字效果吗？

yeahhe · 2026 年2 月 5 日 12:32

是的，只要你选对API就能复刻，要选录音文件识别API

linuxlove · 2026 年2 月 5 日 12:43

试下开源的qwen asr3

yeahhe · 2026 年2 月 5 日 12:52

我记得这个模型以前是闭源的时候，我就用了很多次了。如果这个模型很强的话，我就不会改用豆包语音了

joegodwanggod · 2026 年2 月 5 日 12:53

豆包是真的又快又好

yeahhe · 2026 年2 月 5 日 12:56

我试了一下用 API 调用千问和豆包的这两种模型，效果还是差别很大

musistudio · 2026 年2 月 5 日 12:58

豆包好是好，这个价格也比千问贵好多，佬有试过elevenlabs的语音识别吗

yeahhe · 2026 年2 月 5 日 13:01

我查了一下，好像是豆包更便宜吧

yeahhe · 2026 年2 月 5 日 13:03

而且免费送20小时，如果你只是用来语音输入，这完全够用了

derick · 2026 年2 月 5 日 13:09

通过几个app上自带的英语模式学习，发现豆包的识别是最高的，我们发音很不标准，但他能识别修改，

xinghe314 · 2026 年2 月 5 日 13:13

最近怎么发现佬友一直研究豆包输入法，是和它杠上了吗

yeahhe · 2026 年2 月 5 日 13:15

因为这个最好用，我要在我的别的项目上调用API复刻出这样的效果

xiaotian2333 · 2026 年2 月 5 日 13:16

豆包输入法的语音识别很强吗，我没有使用过
平时用搜狗感觉正常的输入没问题，有同音字或者网络热词容易识别不出来

yeahhe · 2026 年2 月 5 日 13:22

感觉搜狗、百度、讯飞的输入法识别率都差不多，和现在的AI输入法差距都挺大的

xiaotian2333 · 2026 年2 月 5 日 13:26

老一套的输入法都是可以用离线识别的，现在的AI输入法都是在线
应该是离线跟在线识别实际的模型是一样的

yeahhe · 2026 年2 月 5 日 13:28

豆包输入法也有离线版本，要150兆

xiaotian2333 · 2026 年2 月 5 日 13:36

那就有意思了，我下载试试

xiaotian2333 · 2026 年2 月 5 日 13:50

好奇怪，抓包抓不到语音识别的相关请求，但是其他的请求就能抓到
比如上报输入内容，设备信息等的包都能看到

话题		回复	浏览量
打开Pandora魔盒，再撅OpenAI一次之：whisper + tts 资源荟萃 ChatGPT , OpenAI , Pandora , TTS , 人工智能	371	13137	2024 年12 月 9 日
【开源】按住说话-Windows平台语音输入转文本小工具（5MB）（qwen-asr-flash/doubao驱动，支持自定义润色）开发调优软件开发	179	2004	2026 年1 月 24 日
Warp to 半成品(Opus 4.1) 开发调优 OpenAI , 人工智能 , 软件开发	35	1730	2025 年9 月 14 日
同学下载了恶意app 开发调优网络安全	102	1333	2025 年4 月 19 日
豆包语音转文字真的太好使了，又快又准搞七捻三快问快答 , 纯水	53	2502	2025 年11 月 11 日