自动音素转录模型的开发工具

persephone的Python项目详细描述


Persephone v0.4.0(测试版)

persephone(/p_r_s_f_ni/)是一种自动音素转录工具。 传统的语音识别工具需要较大的发音 词典(描述单词如何发音)和大量的训练数据 系统可以学习输出正字法文字。在 相反,persephone是为训练数据 有限的,可能只有一个小时的转录演讲。如此 在低资源的文档中,对数据的限制是常见的 语言。可以使用如此少量的数据来训练 有助于转录的转录模型 尚未被广泛采用。

The speech recognition tool presented here is named after the goddess who was abducted by Hades and must spend one half of each year in the Underworld. Which of linguistics or computer science is Hell, and which the joyful world of spring and light? For each it’s the other, of course. — Alexis Michaud

珀尔塞福涅的目标是使最先进的音素 参与语言文档的人可以使用的转录。 创建一个易于使用的用户界面是关键。用户 接口和api是一个正在进行的工作,目前persephone必须 通过命令行运行。

该工具是用python/tensorflow实现的,考虑到了可扩展性。 目前只实现了一个模型,它使用双向long 短时记忆(lstms)与连接主义时间分类 (CTC)损失函数。

我们很乐意为任何想使用它的人提供直接帮助。 请使用discussion mailing list 讨论有关此项目的问题。 我们也非常欢迎大家的想法,建设性的批评,帮助 设计、开发和文档,以及任何bug reportspull requests你可能有。

文档

文档可以找到here

贡献者

persephone是基于以下代码构建的:

引文

如果您在出版物中使用此代码,请引用Evaluating Phonemic Transcription of Low-Resource Tonal Languages for Language Documentation

@inproceedings{adams18evaluating,
title = {Evaluating phonemic transcription of low-resource tonal languages for language documentation},
author = {Adams, Oliver and Cohn, Trevor and Neubig, Graham and Cruz, Hilaria and Bird, Steven and Michaud, Alexis},
booktitle = {Proceedings of LREC 2018},
year = {2018}
}

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何在ArrayList<List>中选择我的列表中的哪一列用于排序我的ArrayList?   Java设计模式相当于Smalltalk的:   如何在Java中说stringA>stringB   用Python重写Java代码的Python方式   java如何在Mybatis for Postgresql db中使用like(非IN)编写查询?   java看不到如何禁用AlertDialog对话框   java正常转换,但照明仍然很奇怪?   为什么Java中存在检查和未检查异常   使用Flink的JavaSpringBootGradle项目不起作用   java我可以在最终hashmap中存储函数名以供执行吗?   java无法理解实际应用程序中的枚举   java Hibernate注释执行内部连接   java Jenkins Maven3错误,工件已启用   数组的java打印内容只返回[null,null,null,null]   java对同一实体的多个更新   java将日期从一个时区转换为本地时区   jface tableviewer中的java多行功能或换行文本功能   ArrayList是如何在Java中实现的?   如何将程序的输出像矩阵一样写入文件,Java   java EasyMock和返回泛型类的方法