俄语、英语、芬兰语和爱沙尼亚语的语音算法(soundex和变音)

fonetika的Python项目详细描述


福奈蒂卡

基于soundex/metaphone的俄语、英语、爱沙尼亚语和芬兰语语音算法。

软件包实现了音素转换为字母数字序列和距离引擎,用于比较语音序列(基于levenstein和hamming距离)。

快速启动

  1. 通过pip
  2. 安装此软件包
pipinstallfonetika
  1. 导入Soundex算法。

包支持很多机会,可以剪切结果序列(如原始soundex版本)或编码元音。

fromfonetika.soundeximportRussianSoundexsoundex=RussianSoundex(delete_first_letter=True)soundex.transform('ёлочка')...J070530soundex=Soundex(delete_first_letter=True,code_vowels=True)soundex.transform('ёлочка')...JA7A53A

A structure of the library is scalable, RussianSoundex class inherits basic class Soundex (original for English language). In order to extend our algorithm, you need just inherit own class from Soundex and override methods.

  1. 导入soundex距离以使用字符串比较
fromfonetika.distanceimportPhoneticsInnerLanguageDistancesoundex=RussianSoundex(delete_first_letter=True)phon_distance=PhoneticsInnerLanguageDistance(soundex)phon_distance.distance('ёлочка','йолочка')...0
  1. 你也可以计算两种语言的单词之间的距离。这将有助于与一个语言家庭小组合作。
fromfonetika.distanceimportPhoneticsBetweenLanguagesDistancem1=FinnishMetaphone(reduce_word=False)m2=EstonianMetaphone(reduce_word=False)phon_distance=PhoneticsBetweenLanguagesDistance(m1,m2)phon_distance.distance('yö','öö')...1

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
未绘制java OpenGL顶点   swing无法在Java框架中设置文本   java使用xmemcached客户端访问AWS ElastiCache   java将元素添加到默认arraylist   java从给定位置向后逐个字符地读取文件   java将为此处显示的代码创建多少个对象?   Java异步返回CompletableFuture   java在滚动视图中显示图像   我想为用Netbeans开发的Java项目创建安装程序,并使用Mysql Xampp   java是否可以将COUNT与不同的JPA投影一起使用?   java如何定制javafx。场景图表NumberAxis用于更改20个主要记号的硬编码上限   javajavax。xml。ws。WebServiceException:无法访问WSDL   Jboss中的java多线程   java类不是抽象类,并且不重写抽象方法actionPerformed(ActionEvent)   基于java Spring安全令牌的身份验证   java如何在Spring MVC的自定义验证器中从属性文件中读取参数值   使用OpenCV和java在Android中点击获取图像维度?   java无法解析为变量解析。通用域名格式