最近发现了一个AI虚拟主播Neurosama,感觉做的挺好的,挺好奇做出这样一个能直播的虚拟主播都需要哪些技术,还有就是什么样算力的硬件设备能够实现这种效果 ![]()
9 个赞
现在的版本应该是vedel自己调优的本地大模型
1 个赞
回复错了,哈哈哈
坐等一位大佬的解释。原来vedel是本地跑的,当时应该就是用游戏显卡跑的,现在应该是租的GPU服务器,显卡就到直播用的游戏PC上了。
不过感觉两个牛肉的热度都比欧洲的其他AI加起来还高了,恐怕复刻门槛不会太低吧…
佬你是没了解这个主播,这个背后不是真人,是AI驱动的,包括2d面部移动和表情变化以及3d的模型运动。和所谓的皮套完全不一样
2 个赞
并非面捕 牛肉是ai ![]()
啊?这是纯AI?那估计就是2Dlive+纯AI动态调教了,国内emmm目前没有,而且没有一个平台目前允许纯AI的无人直播(抖音就算皮套都要报备的,B站松一点)。而且很贵哇
好像提到过牛肉每个月运行成本几千美刀呢
1 个赞
这种类似的皮套看多了,哈哈哈哈,习惯性
1 个赞
这里有个致敬 Neuro-sama的github项目,之前部署在本地试过,是一个ai+浏览器/桌面桌宠,(具体情况不太了解)。我当时也顺便部署了b站的indexTTS,然后用ai(augment)将它两整合到了一起
2 个赞
大概率是真人扮的
这个v出道时间比ChatGPT发布还早好几个月
4 个赞
谢谢佬,我去看看这个项目学习一下
主要技术就那一套,LLM,VLM,Memory 模块,微调,tts,stt(感觉用端到端语音模型可能性不大)。neuro有些游戏模块可能是比较独立的,这方面可能没那么清楚,osu!这种可能是视觉输入+一些强化学习,mc可能也类似,但是工程上你要搞成这种效果是不好做的
2 个赞
看过,这个项目好像是主要twitch上面直播的吧
b站是自己搬运过来了。
视频里面自己说只是赚的和花的一样。
2 个赞
