猜猜法语单词的最后一个音素

frhyme的Python项目详细描述


frhyme——一个猜测法语单词最后一个音素的工具包 存储库URL:https://gitlab.com/a3nm/frhyme python包名称:frhyme

=0。作者和许可证==

FRHyme版权所有(c)2011-2019,由Antoine Amarilli所有

frhyme是一个自由软件,在麻省理工学院的许可下发布:参见 申请许可证以获取适用于FRHYME的许可条款的详细信息。

非常感谢Julien Romero为 弗海姆。

“frhyme”目录中的文件“frhyme.json”是 法语词汇数据库LyiQuehttp://www.lexique.org/,版本 3.83,作者Boris Newhttp://psycho-usmb.fr/boris.new/和Christophe 苍白的http://www.pallier.org/。因此,这个文件在同一个 许可证为Lexique,即许可证CC由SA 4(根据 在Lexique的可下载存档中,文件Read MeXiqQu.txt。这个 许可证中的许可证不适用于此文件“frhyme/frhyme.json”。

==1。功能==

frhyme是一个猜测法语单词最后一个音素是什么的工具。 它被训练在一个单词表上,上面有相关的发音,并且 用已知的单词推断一些可能的不可见单词的可能性 最长的公共前缀,使用trie作为内部表示。

=2个。安装==

你需要一个工作的python3环境来运行frhyme。

您可以通过执行以下操作直接使用pip安装frhyme:

pip3安装frhyme

您还可以手动克隆项目存储库并使用frhyme 直接从那里。

==3。用法==

您可以运行

frhyme.py[nbest]

在stdin中每行给出一个单词,并获得nbest top stdout上的发音(默认为5),或者您可以在 python程序并调用frhyme.lookup(word,nbest)返回 nbest top发音(默认为5)。

返回的发音用置信分数(the 培训数据中出现的次数)。他们应该理智点 到训练中出现的输入单词的最长前缀 数据,但它们的前缀可能是垃圾。

发音以x-sampa的变体给出,确保 每个音素都映射到一个ascii字符:替换 是“a~”=>;“”,“o~”=>;“$”,“e~”=>;“)”,“9~”=>;“(”。

=4个。培训==

本节介绍如何准备文件“frhyme.json”。你知道的 使用frhyme不需要这样做,但是如果你想 从其他源创建发音数据库。

提供的“fryhme.json”文件是在 数据库LyxQuehttp://www.lexique.org/,有一些补充。你可以 重新生成如下:

Git克隆“https://a3nm.net/git/lexique” CD脚本 /Ma.SH 4 & lt;(剪切-F 1,1,2/…Listiq/LexiQuixMyOrthyFix.Unq)加和g/../Frime/Frime. JSON

值“4”表示要保留的尾随音素的数量,并且可以 被改变。小心,这个过程可能占用几百兆字节 拉姆。生成的文件应准确地包含以下法语单词: Lexique。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java ajax请求不允许POST请求   java引用Android应用程序中其他模块的通用模块   JavaSpringBootWebFluxFlatmap是链接http调用的正确方法吗?   java如何在底部工作表中设置折叠工具栏?   任务“:compileJava”的java执行失败。“>无效的源版本:1.7   java Rabbit MQ不刷新ACK?   JavaWebSphere7:METAINF/config/ibmaxis2。无法正确加载xml Axis2全局配置文件   在Java中找出字符串是否包含数组中的值   java Liquibase通过Springboot执行postgres方法   java在Eclipse中安装Maven而不使用插件   Swing应用程序中的java SMTP错误   web应用程序InvalidKeyException:Java中使用RSA密钥的密钥格式无效   java显示JFrame作为JButton单击的结果?   java如何保留Apache Camel Exchange的属性,如果消息是从RabbitMQ生成和使用的   java使用流提取哈希映射列表中的所有对象   Android应用程序中的java单词检查器