中国明星声纹库CN
发布时间:2024-12-11 08:13
12月14日,信息国家研究中心智能科学研究部语音和语言技术团队在语音开源平台Kaldi上公布了中国明星声纹数据集CN-Celeb的说话人识别基础流程(Recipe)。研究者可以依此流程构建属于自己的说话人识别系统。
CN-Celeb是由语音和语言技术团队近日公布的一个中国明星声纹库。项目组成员包括实习生范悦、亢嘉文、李开诚、陈浩林、程思潼、张鹏远、周子雅等(指导老师王东、李蓝天、蔡云麒)。该声纹库包含1,000名中国明星(包括歌星、影星、说唱艺人等)在采访、歌舞及影视作品中的声音片段。每位明星的声音时长大约20分钟,整个数据集近300小时。该数据包含了11类实际场景,覆盖了噪音、信道、发音方式等各方面的复杂性,特别适合研究复杂场景下的说话人识别技术。研究者可在共享资源网站http://openslr.org搜索CN-Celeb免费下载。
Kaldi是语音领域最活跃的开源平台,由著名学者Dan Povey发起并维护,吸引了众多研究者参与开发。目前,Kaldi中已经有语音识别、说话人识别、语种识别等标准Recipe近90个。基于CN-Celeb数据库,语音和语言技术团队近日提交了一份说话人识别Recipe,并于今日Merge 到Main Branch中。这是第一份中文说话人识别的Kaldi Recipe。研究者可以通过下载最新的Kaldi系统进行实验验证。
基于 CN-Celeb 的 Kaldi Recipe
网址:中国明星声纹库CN http://c.mxgxt.com/news/view/147454
下一篇: 文娱:我真没想当明星啊最新章节:
相关内容
NBA明星库里,被美国女子乒乓球队耍了,她们用库里的手机自拍…韩国男星时尚纹身大盘点
零库存在中国是否可行?库存管理=仓库管理?库存控制就是减库存?
理士独家解析体育明星纹身版权归属
粉丝网明星库
中国图库
如何看明星话题数据库
中国历史人物传记数据库
网红为什么不能成为明星?网红为什么都有纹身?
cn吃瓜:友热议最新娱乐八卦