注释发音的小示例数据集
pollyglot的Python项目详细描述
pollyglot公司
注释发音的小示例数据集。在
如果您有以下情况,则非常有用:
- 需要一些快速下载的示例发音吗
- 构建一个可以使用不同注释格式的工具 你想测试一下这个工具
使用
pollyglot
有两个组件:
- 创建小示例数据集的命令行工具 更大的公共可用数据集
- 获取小示例数据集的包,它可以是 对库的依赖关系
要使用(1),请调用命令行工具pollymake
克隆此存储库,安装它以进行开发(见下文),然后调用
$ pollymake all
将在存储库中重新生成数据集。在
pollymake
从每个存储库创建一个存档。然后将这些数据上载到Figshare数据集存储库:
https://figshare.com/articles/pollyglot/9929549
此包的目标是共享自动创建数据过程的代码
在FigShare上存储库,并将此源代码开放以供协作。这个
此存储库中的格式可以由
Crowsetta包。开发和
crowsetta
的教程利用了
从存储库中的源代码生成的Figshare上的每个格式。在
crowsetta
为任何想编写干净代码的人提供工具
使用这些注释格式(或它们自己的格式)时
要了解更多信息,请访问https://github.com/NickleDave/crowsetta
格式+参考
以下是包括的格式和参考资料的来源。在
普拉特文本网格
Praat程序输出的Textgrids。在
Praat textgrid格式的歌曲来自Birdsong数据库
加州大学洛杉矶分校泰勒实验室:
http://taylor0.biology.ucla.edu/birdDBQuery/
{a5}本文
.xls文件包含来自Taylor lab birdsong数据库的歌曲链接
由Tim Sainburg创建,用于训练动物发声的生成网络:
https://github.com/timsainb/AVGN;根据麻省理工学院的许可改编。在
一。不,mat
一。不,mat文件由Brainard实验室的Evren Tumer创建的EvsongAnalyz GUI输出。 音频文件格式.cbin由Labview程序EvTAF输出。在
另一个以这种格式注释的孟加拉芬奇歌曲的存储库如下: https://figshare.com/articles/Bengalese_Finch_song_repository/4805749
鸟鸣识别
标记为孟加拉芬奇歌曲的存储库的特定.xml格式。 存储库在这里: https://figshare.com/articles/BirdsongRecognition/3470165。 存储库为测试卷积神经网络进行分段提供数据 并标记在存储库中共享的声音 https://github.com/takuya-koumura/birdsong-recognition 并在“鸟鸣中元素类和边界的自动识别”一文中进行了讨论 《可变序列》作者:Takuya Koumura和Kazuo Okanoya (http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0159188)。在
项目信息
许可证
David Nicholson的Pollyglot(c),2018-2019年。在
代码在BSD-3 License下共享。在
在适用的情况下,声音注释格式数据集中的数据是许可的 根据Creative Commons Attribution Sharelike4.0国际许可。 (figshare存储库在CC-BY-4.0下共享) 如果作者没有用许可证表明他们的意图, 论文的引文和原始来源的链接也包括在内。 如果对此有任何顾虑,请在此存储库中提出问题。在
你应该会收到一个copy of the license和这个 工作。如果没有,请参见http://creativecommons.org/licenses/by-sa/4.0/。在
- 项目
标签: