Skip to content

中文开源语音大模型计划 #2097

@xingchensong

Description

@xingchensong

宗旨

  1. 毛主席说,没有调查就没有发言权,我们采访了很多开发者得出结论:对于有数据闭环和迭代需求的公司,微调是刚需。我们的宗旨是 人人都能快速方便地训练和部署语音大模型,这里突出一个 字,大模型的训练和部署,和小模型基本是两套不同方案,在 “微调是刚需” 的前提下,结合大模型的时代背景和趋势所向,如何方便快捷地 训练/魔改(微调)和 部署 语音大模型,会是即将到来时代的痛点,解决这个痛点,就是 next gen wenet 的任务,也即 wenet 3.0 的总目标。
  2. 数据、模型、代码全部都会开源开放,欢迎大家贡献,有数据的出数据,有意见的出意见,有机器的出机器,大家共创。

目标

  1. 中文开源语音大模型,开源的效果最好的中文模型,具备流式识别能力(其他语种做不做?做到什么程度?开放不设限,且做且分析)
  2. wepipe,积累一套从 [数据爬取](wecrawler)-> [数据处理](借助wesubtitle制作标注和将来的wedata过滤低质量数据)-> [大模型增量训练] 完整pipeline

Action

数据

训练

部署

  • int4量化,降低带宽需求

Metadata

Metadata

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions