用于MIR研究的多功能音乐数据库
用于MIR研究的多功能音乐数据库(CCMusic) Multi-functional Music Database for MIR Research
钢琴音质数据集本数据集收录了中国音乐学院琴房7种型号钢琴(KAWAI立式钢琴、KAWAI三角钢琴、英昌立式钢琴、星海立式钢琴、大剧院施坦威钢琴、施坦威三角钢琴、珠江立式钢琴)的全音域音频文件12个(.wav/.mp3/.m4a格式),以及拆分后的单音音频文件1320个(.wav/.mp3/.m4a格式),共计1332个文件。此外还有《钢琴音质主观评价问卷调查》1个(.xls格式),包括29人参与钢琴音质主观评价的打分情况。
以KAWAI三角钢琴为例,列表如下:
序号 文件名称 演奏内容 文件大小 时长(min) 文件格式 demo试听 1 KAWAI-Grand.wav KAWAI三角钢琴大字一组C-大字组C半音阶音频 20.9 MB (21,965,182 字节) 19:20 .wav(RIFF) 2 7100.wav KAWAI三角钢琴大字一组C单音音频 994 KB (1,017,928 字节) 00:05 .wav(RIFF) 3 7101.wav KAWAI三角钢琴大字一组#C单音音频 1.15 MB (1,211,800 字节) 00:06 .wav(RIFF) 4 7102.wav KAWAI三角钢琴大字一组D单音音频 1.13 MB (1,195,640 字节) 00:06 .wav(RIFF) 5 7103.wav KAWAI三角钢琴大字一组#D单音音频 1.17 MB (1,227,960 字节) 00:06 .wav(RIFF) 6 7104.wav KAWAI三角钢琴大字一组E单音音频 1.06 MB (1,114,864 字节) 00:06 .wav(RIFF) 7 7105.wav KAWAI三角钢琴大字一组F单音音频 1.12 MB (1,179,488 字节) 00:06 .wav(RIFF) 8 7106.wav KAWAI三角钢琴大字一组#F单音音频 1.20 MB (1,260,264 字节) 00:07 .wav(RIFF) 9 7107.wav KAWAI三角钢琴大字一组G单音音频 1.00 MB (1,050,244 字节) 00:05 .wav(RIFF) 10 7108.wav KAWAI三角钢琴大字一组#G单音音频 1.09 MB (1,147,180 字节) 00:06 .wav(RIFF) 11 7109.wav KAWAI三角钢琴大字一组A单音音频 899 KB (920,996 字节) 00:05 .wav(RIFF) 12 7110.wav KAWAI三角钢琴大字一组#A单音音频 1.06 MB (1,114,868 字节) 00:06 .wav(RIFF) 13 7111.wav KAWAI三角钢琴大字一组B单音音频 946 KB (969,468 字节) 00:05 .wav(RIFF) 14 7200.wav KAWAI三角钢琴大字组C单音音频 946 KB (969,464 字节) 00:05 .wav(RIFF) 歌唱干声评价数据集本数据集包含由22位歌手翻唱的6首普通话歌曲,共132段(.wav格式),每段翻唱均由一段主歌及一段副歌组成。由4位专业评委从音准、节奏、音域、音色、发音、颤音、音量变化、气息控制、整体表现等九个方面进行评价打分,满分10分制。打分情况记录在《调查问卷评分结果》中。
从六首歌曲中分别选出一位歌手的演唱,列表如下:
序号 文件名称 歌手 演唱内容 文件大小 时长(min) 文件格式 demo试听 1 HY_至少还有你demo.wav HY 歌曲《至少还有你》 16.8 MB (17,683,338 字节) 00:30 .wav(RIFF) 2 LJQ_但愿人长久demo.wav LJQ 歌曲《但愿人长久》 12.3 MB (12,960,102 字节) 00:22 .wav(RIFF) 3 SCX_我只在乎你demo.wav SCX 歌曲《我只在乎你》 7.47 MB (7,833,702 字节) 00:13 .wav(RIFF) 4 WHL_如果没有你demo.wav WHL 歌曲《如果没有你》 16.7 MB (17,568,102 字节) 00:30 .wav(RIFF) 5 WZB_月亮代表我的心demo.wav WZB 歌曲《月亮代表我的心》 16.7 MB (17,568,102 字节) 00:24 .wav(RIFF) 6 YHA_甜蜜蜜demo.wav YHA 歌曲《甜蜜蜜》 16.7 MB (17,568,102 字节) 00:19 .wav(RIFF) 真假声数据集本数据集包含1280个用真声/假声演唱的单音音频文件(.wav格式),真声被标记为_chest,假声被标记为_falsetto。此外还收录了每段音频的标注标签、mel spectrogram、MFCC、频谱特征,共计5120个.csv文件。
例子如下:
序号 文件名称 内容 melspect mfcc spectral feature demo试听 1 0011_m_chest.wav 真声演唱 2 0012_m_chest.wav 真声演唱 3 0013_m_chest.wav 真声演唱 4 0014_m_chest.wav 真声演唱 5 0015_m_chest.wav 真声演唱 6 0016_m_chest.wav 真声演唱 7 0017_m_chest.wav 真声演唱 8 0018_m_chest.wav 真声演唱 9 0019_m_chest.wav 真声演唱 10 0020_m_chest.wav 真声演唱 11 0031_m_falsetto.wav 假声演唱 12 0032_m_falsetto.wav 假声演唱 13 0033_m_falsetto.wav 假声演唱 14 0034_m_falsetto.wav 假声演唱 15 0035_m_falsetto.wav 假声演唱 16 0036_m_falsetto.wav 假声演唱 17 0037_m_falsetto.wav 假声演唱 18 0038_m_falsetto.wav 假声演唱 19 0039_m_falsetto.wav 假声演唱 20 0040_m_falsetto.wav 假声演唱 民族乐器音色打分数据集本数据集是用于对37种民族乐器的音色主观评价实验,包含用作音色主观评价实验的汇总音频素材1个(.wav格式),以及14人参与的37种乐器在16个音色评价词上的音色主观评价实验(1~10分)打分表(.xlsx格式)。此外还有对10种乐器的频谱分析报告10个(.docx格式),乐器音频来自 中国传统乐器音响数据库(CTIS) 。
部分文件列表如下:
序号 文件名称 内容 文件大小 文件格式 下载 1 古筝声学测量及频谱分析报告.docx 古筝声学测量及频谱分析报告(包括音高、泛音分析、动态范围分析、频谱分析) 546 KB (559,540 字节) .docx 2 柳琴声学测量及频谱分析报告.docx 柳琴声学测量及频谱分析报告(包括音高、泛音分析、动态范围分析、频谱分析) 390 KB (400,272 字节) .docx 3 音色评价实验结果-音色评价词-柔和单薄纯净.xlsx 14人参与37种乐器在“柔和”、“单薄”、“纯净”3个音色评价词上的打分结果以及均值和标准差 40.8 KB (41,880 字节) .xlsx 4 音色评价实验结果-标准差分析.xlsx 14人参与37种乐器在16个音色评价词上的打分结果的标准差分析 26.8 KB (27,453 字节) .xlsx 5 音色评价实验素材-1-37.wav 用于音色主观评价实验的汇总音频素材,包含经过裁剪的37件乐器的音频片段,音频来自中国传统乐器音响数据库 21.2 MB (22,273,593 字节) .wav(RIFF) Demo下载:点击此处下载以上所有demo文件
相关文献:本数据集在以下文章中进行了详细的描述:
江益靓, 孙校珩, 梁晓晶, 子晋, 李伟. 基于客观特征的民族乐器音色分析[J]. 复旦学报(自然科学版), 2020,59(03):346-353+359. Jiang W, Liu J, Li Z, et al. Analysis and modeling of timbre perception features of chinese musical instruments[C]//2019IEEE/ACIS 18th International Conference on Computer and Information Science (ICIS). IEEE, 2019: 191-195. 音乐流派数据集本数据集包含至少1700首不同流派音乐的音频(.mp3格式,来自网易云),每段音频时长约270~300秒。数据库共分为17个流派,每个流派对应一个标注文件,标注信息为流派分类标签,用于流派分类任务。主要的流派标签:古典(symphony, opera, solo, chamber)、非古典(pop, dance&house, indie, soul/r&b, rock)。
标注信息的格式: file_name, duration, singer, fst_level_label, sec_level_label, thr_level_label
以非古典non-classical流派(标注标签为2)的摇滚rock流派(标注标签为11)的Adult Alternative Rock流派(标注标签为19)为例,部分列表如下:
本数据集包含音色和音域2个子数据库。
1.音色数据集包含录制的9名歌手的干声演唱音频,以及经过剪切、重新拼接后的音频片段,共计775段(.wav格式)。
2.音域数据集包括若干人声演唱的上、下行半音阶音频,以及剪切后的单音音频素材。此外还有音频波形文件若干。
音色数据集以singer 2 的演唱为例,列表如下:
序号 文件名称 内容 文件大小 时长 文件格式 demo试听 1 singer2.wav singer2演唱干声片段(6s) 1.05 MB (1,109,742 字节) 6s .wav(RIFF) 2 singer2-1.wav singer2演唱干声剪切拼贴后片段 2.06 MB (2,162,706 字节) 24s .wav(RIFF) 3 singer2-1-1.wav singer2演唱干声片段剪切为10段之1 2.52 MB (2,646,042 字节) 29s .wav(RIFF) 4 singer2-1-2.wav singer2演唱干声片段剪切为10段之2 2.52 MB (2,646,042 字节) 29s .wav(RIFF) 5 singer2-1-3.wav singer2演唱干声片段剪切为10段之3 2.52 MB (2,646,042 字节) 29s .wav(RIFF) 6 singer2-1-4.wav singer2演唱干声片段剪切为10段之4 2.52 MB (2,646,042 字节) 29s .wav(RIFF) 7 singer2-1-5.wav singer2演唱干声片段剪切为10段之5 2.52 MB (2,646,042 字节) 29s .wav(RIFF) 8 singer2-1-6.wav singer2演唱干声片段剪切为10段之6 2.52 MB (2,646,042 字节) 29s .wav(RIFF) 9 singer2-1-7.wav singer2演唱干声片段剪切为10段之7 2.52 MB (2,646,042 字节) 29s .wav(RIFF) 10 singer2-1-8.wav singer2演唱干声片段剪切为10段之8 2.52 MB (2,646,042 字节) 29s .wav(RIFF) 11 singer2-1-9.wav singer2演唱干声片段剪切为10段之9 2.52 MB (2,646,042 字节) 29s .wav(RIFF) 12 singer2-1-10.wav singer2演唱干声片段剪切为10段之10 2.52 MB (2,646,042 字节) 29s .wav(RIFF)音域数据集以singer 19 的演唱为例,列表如下:
序号 文件名称 内容 文件大小 时长 文件格式 demo试听/下载 1 vox1_19.wav singer 19 演唱半音阶下行 5.18 MB (5,436,854 字节) 37s .wav(RIFF) 2 vox1_19.pkf singer 19 演唱半音阶下行音频波形 219 KB (224,680 字节) / .pkf 3 vox1_19-1.wav singer 19 演唱小字一组C 85.9 KB (88,054 字节) / .wav(RIFF) 4 vox1_19-2.wav singer 19 演唱小字组B 106 KB (108,814 字节) / .wav(RIFF) 5 vox1_19-3.wav singer 19 演唱小字组#A 241 KB (247,458 字节) / .wav(RIFF) 6 vox1_19-4.wav singer 19 演唱小字组A 103 KB (106,398 字节) / .wav(RIFF) 7 vox1_19-5.wav singer 19 演唱小字组#G 94.4 KB (96,730 字节) / .wav(RIFF) 歌曲结构标注数据集本数据集包含300首流行歌曲(.mp3格式,来自网易云),以及每首歌曲的结构性标注文件(.txt格式)。歌曲结构:intro, chorus, verse,pre-chorus, post-chorus, bridge, ending。
以“Britney Spears - Toxic (Bloodshy & Avant's Intoxicated Remix)”和“Backstreet Boys - Darlin'”为例,标注信息列表如下:
序号 开始时间(0.01s) 结束时间(0.01s) 结构标注 demo 序号 开始时间(0.01s) 结束时间(0.01s) 结构标注 demo 1 0000 4241 "Intro" Britney Spears - Toxic 1 0000 2486 "Intro" Backstreet Boys - Darlin' 2 4241 6924 "Verse A" 2 2486 4054 "Verse A" 3 6924 8606 "Pre-chorus A" 3 4054 5628 "Verse B" 4 8606 11289 "Chorus A" 4 5628 8778 "Chorus A" 5 11289 12631 "Re-intro A" 5 8778 10350 "Verse C" 6 12631 13977 "Verse B" 6 10350 11920 "Verse D" 7 13977 15655 "Pre-chorus B" 7 11920 15072 "Chorus B" 8 15655 19681 "Chorus B" 8 15072 18607 "Bridge" 9 19681 24043 "Re-intro B" 9 18607 21763 "Chorus C" 10 24043 26730 "Chorus C" 10 21763 23334 "Re-intro" 11 26730 28072 "Bridge A" 11 23334 26861 "Chorus D" 12 28072 29417 "Re-intro C" 12 26861 30015 "Chorus E" 13 29417 33443 "Chorus D" 13 30015 32758 "Chorus F" 二胡演奏技法数据集本数据集包含1500个二胡音频片段(.wav格式),所有音频均由专业二胡演奏家演奏。根据二胡不同的演奏技法,将它们分为11类(分弓、垫弓、泛音、连弓&滑音&大滑音、击弓、拨弦、抛弓、顿弓、颤弓、颤音、揉弦)。每种演奏技法都有对应的若干个音频。音频来自: 中国传统乐器音响数据库(CTIS) 。
每种技法对应的部分音频列表如下:
序号 文件名称 演奏技法 文件大小 文件格式 demo试听 1 detache_01.wav 分弓 256 KB (262,372 字节) .wav 2 diangong_01.wav 垫弓 114 KB (116,940 字节) .wav 3 harmonic_natural_05.wav 泛音-自然泛音 215 KB (220,874 字节) .wav 4 harmonic_artificial_02.wav 泛音-人工泛音 153 KB (157,008 字节) .wav 5 glissando_down_05.wav 大滑音-下行 44.0 KB (45,064 字节) .wav 6 glissando_up_03.wav 大滑音-上行 39.5 KB (40,464 字节) .wav 7 huihuayin_long_04.wav 滑音-后回滑音 178 KB (183,248 字节) .wav 8 legato&slide_up_01.wav 连弓-向上连弓 包含滑音 183 KB (188,206 字节) .wav 9 slide_dianzhi_03.wav 滑音-垫指滑音 78.7 KB (80,626 字节) .wav 10 dajigong_05.wav 击弓-大击弓 188 KB (192,646 字节) .wav 11 horse_03.wav 击弓-马嘶 168 KB (172,920 字节) .wav 12 pizzicato_07.wav 拨弦 25.1 KB (25,704 字节) .wav 13 ricochet_11.wav 抛弓 64.6 KB (66,246 字节) .wav 14 staccato_07.wav 顿弓 31.0 KB (31,812 字节) .wav 15 tremolo_03.wav 颤弓 124 KB (127,082 字节) .wav 16 trill_long_01.wav 颤音-长颤音 205 KB (210,490 字节) .wav 17 vibrato_late_01.wav 揉弦 236 KB (242,574 字节) .wav 美声民族唱法数据集本数据集专门用于区分美声、民族唱法,所有音频均由专业歌唱家演唱。
部分音频列表如下:
序号 文件名称 性别 唱法 文件大小 文件格式 demo试听 1 干牛山 女 民族.wav 女 民族唱法 1.23 MB (1,291,292 字节) .wav 2 草原牧歌 男 民族.wav 男 民族唱法 9.63 MB (10,105,288 字节) .wav 3 美丽乡村 女 美声.wav 女 美声唱法 10.7 MB (11,325,040 字节) .wav 4 黄河颂 男 美声.wav 男 美声唱法 3.27 MB (3,433,670 字节) .wav 古筝演奏技法GZ_IsoTech数据集 © 复旦大学版权所有本数据集包含2824个古筝单技法音频片段(.wav格式)。其中2328个片段是从虚拟音源中收集得到,496个片段是由专业古筝演奏家弹奏并录制的。这些片段几乎涵盖了古筝音域范围内的音调以及最常用的技法。根据古筝不同的演奏技法,将它们分为8类:颤音、上滑音、下滑音、回滑音、刮奏(刮奏、花指)、摇指、泛音、拨弦(勾、打、抹、托……)。每种演奏技法都有若干个对应的音频。
古筝演奏家弹奏的部分数据列表如下:
序号 演奏技法名称 文件大小 wav文件 demo试听 1 上滑音 147 KB (145,496 字节) 2 下滑音 168 KB (167,924 字节) 3 颤音 172 KB (168,682 字节) 4 回滑音 94 KB (93,342 字节) 5 刮奏 332 KB (330,440 字节) 6 摇指 193 KB (188,810 字节) 7 泛音 57 KB (54,160 字节) 8 拨弦 78 KB (74,696 字节)网址:用于MIR研究的多功能音乐数据库 http://c.mxgxt.com/news/view/230695
相关内容
Starbase数据库使用基于独立音乐人视角的在线音乐平台全产业链合作趋势研究
智慧城市背景下对高校音乐教育研究
中国思想与文化名家数据库试用(至2023年2月28日)
基于大数据的社交网络分析与应用研究.docx
大数据分析技术在社交网络中的应用研究 .pdf
娱乐明星代言数据库是什么
智库星途打造全明星智能数据库,精准链接品牌商务需求
基于数据挖掘的社交网络分析与研究
基于大数据的大学生网络社交行为研究.doc