你甚至不能对她说中文 它无法识别
会显示 can’t catch
看看我的散装英文怎么样 反正他理解了
网络不好的话 他回来会一顿一顿的 不过几乎是秒回 还是很不错的
槽点之一时 它不会自动发送你的语音信息 你必须要点击屏幕任意位置才能发送
你甚至不能对她说中文 它无法识别
会显示 can’t catch
看看我的散装英文怎么样 反正他理解了
网络不好的话 他回来会一顿一顿的 不过几乎是秒回 还是很不错的
槽点之一时 它不会自动发送你的语音信息 你必须要点击屏幕任意位置才能发送
它是像 GPT 一样原生的语音模型吗?还是先转换成文本处理后再转换成语音
如你所见 应该是语音识别了
Gpt不也是转成文字吗
除非你告诉我他转成的文字只是给我自己看的 但是转出来的文字确确实实是他回答的根本 如果他识别错误了 确实会回答错的 那就不是原生 人的听觉是不会出问题的 尤其是在语境完整的情况下
这不去年就有了么
这么能水![]()
那我是顶级非酋了 现在才知道 我也不至于一年没玩
GPT 的语音聊天不是语音转文字,是原生的语音模型,对话框显示的文字只是给你看的。GPT 能够识别你说话的语气、口音,甚至无法转化为文字的东西他也能识别出来。我之前跟他用英语聊了一会,然后问他“根据我发音的标准程度以及口音,我像是英语母语者吗?我的口音最有可能来自哪个国家?”然后他能根据我的口音准确分辨出我来自中国
早就有了 至少一个多月了,只是处于测试版,并且不支持中文识别。
市面上就没几个支持多语言的ai吧,都是你说的话转成文字发给ai,然后ai生成的语言转成语音发给你。练练口语还行
Gemini Live也是一样,可以识别语气,情绪变化