猜猜法语单词的最后一个音素
frhyme的Python项目详细描述
frhyme——一个猜测法语单词最后一个音素的工具包 存储库URL:https://gitlab.com/a3nm/frhyme python包名称:frhyme
=0。作者和许可证==
FRHyme版权所有(c)2011-2019,由Antoine Amarilli所有
frhyme是一个自由软件,在麻省理工学院的许可下发布:参见 申请许可证以获取适用于FRHYME的许可条款的详细信息。
非常感谢Julien Romero为 弗海姆。
“frhyme”目录中的文件“frhyme.json”是 法语词汇数据库LyiQuehttp://www.lexique.org/,版本 3.83,作者Boris Newhttp://psycho-usmb.fr/boris.new/和Christophe 苍白的http://www.pallier.org/。因此,这个文件在同一个 许可证为Lexique,即许可证CC由SA 4(根据 在Lexique的可下载存档中,文件Read MeXiqQu.txt。这个 许可证中的许可证不适用于此文件“frhyme/frhyme.json”。
==1。功能==
frhyme是一个猜测法语单词最后一个音素是什么的工具。 它被训练在一个单词表上,上面有相关的发音,并且 用已知的单词推断一些可能的不可见单词的可能性 最长的公共前缀,使用trie作为内部表示。
=2个。安装==
你需要一个工作的python3环境来运行frhyme。
您可以通过执行以下操作直接使用pip安装frhyme:
pip3安装frhyme
您还可以手动克隆项目存储库并使用frhyme 直接从那里。
==3。用法==
您可以运行
frhyme.py[nbest]
在stdin中每行给出一个单词,并获得nbest top stdout上的发音(默认为5),或者您可以在 python程序并调用frhyme.lookup(word,nbest)返回 nbest top发音(默认为5)。
返回的发音用置信分数(the 培训数据中出现的次数)。他们应该理智点 到训练中出现的输入单词的最长前缀 数据,但它们的前缀可能是垃圾。
发音以x-sampa的变体给出,确保 每个音素都映射到一个ascii字符:替换 是“a~”=>;“”,“o~”=>;“$”,“e~”=>;“)”,“9~”=>;“(”。
=4个。培训==
本节介绍如何准备文件“frhyme.json”。你知道的 使用frhyme不需要这样做,但是如果你想 从其他源创建发音数据库。
提供的“fryhme.json”文件是在 数据库LyxQuehttp://www.lexique.org/,有一些补充。你可以 重新生成如下:
Git克隆“https://a3nm.net/git/lexique” CD脚本 /Ma.SH 4 & lt;(剪切-F 1,1,2/…Listiq/LexiQuixMyOrthyFix.Unq)加和g/../Frime/Frime. JSON
值“4”表示要保留的尾随音素的数量,并且可以 被改变。小心,这个过程可能占用几百兆字节 拉姆。生成的文件应准确地包含以下法语单词: Lexique。