有没有通过调用API,自己实现语音对话的开源项目呢
有一个类似的mi gpt,但是这个是通过小米音箱实现
不借用小米音箱,通过语音转文本 whisper和 文本转语音chattss,实现自己的语音助手server?
有没有通过调用API,自己实现语音对话的开源项目呢
有一个类似的mi gpt,但是这个是通过小米音箱实现
不借用小米音箱,通过语音转文本 whisper和 文本转语音chattss,实现自己的语音助手server?
帮顶一下
始皇的new站就可以语音对话
这个就是调用api的事,自己应该可以封装吧
延迟太大了
可以玩玩这个,
项目地址: livekit/agents: Build real-time multimodal AI applications ![]()
![]()
(github.com)
在线demo: LiveKit Agents Playground: KITT
可以自己改代码替换中文的,也可以多语言版本
始皇的new站是啥
获取失败: access_denied: You tried signing in as “[email protected]” using a password, which is not the authentication method you used during sign up. Try again using the authentication method you used during sign up. (error=identity_provider_mismatch)
这个是啥意思
我之前也有类似的需求,主要是需要监控语音活动还有语音流式转换文本方面不好搞。之前看到一个解决方案没尝试过。
用的始皇new站吗
挂个梯子再试试,语音的话点击进去后那个gpt大图标,不能用临时聊天
挂梯子了
没有呢,我现在还拿不到access token呢,我使用google验证直接登录的openai,现在到了https://token.oaifree.com/auth这里的话登录不进去,提示刚才错误,不能用密码登录
官网登录chatgpt后打开这个地址获取accesstoken
https://chat.openai.com/api/auth/session
点击中间chatgpt图标
嗯嗯 这个可以无限对话吗