俄语、英语、芬兰语和爱沙尼亚语的语音算法(soundex和变音)

fonetika的Python项目详细描述


福奈蒂卡

基于soundex/metaphone的俄语、英语、爱沙尼亚语和芬兰语语音算法。

软件包实现了音素转换为字母数字序列和距离引擎,用于比较语音序列(基于levenstein和hamming距离)。

快速启动

  1. 通过pip
  2. 安装此软件包
pipinstallfonetika
  1. 导入Soundex算法。

包支持很多机会,可以剪切结果序列(如原始soundex版本)或编码元音。

fromfonetika.soundeximportRussianSoundexsoundex=RussianSoundex(delete_first_letter=True)soundex.transform('ёлочка')...J070530soundex=Soundex(delete_first_letter=True,code_vowels=True)soundex.transform('ёлочка')...JA7A53A

A structure of the library is scalable, RussianSoundex class inherits basic class Soundex (original for English language). In order to extend our algorithm, you need just inherit own class from Soundex and override methods.

  1. 导入soundex距离以使用字符串比较
fromfonetika.distanceimportPhoneticsInnerLanguageDistancesoundex=RussianSoundex(delete_first_letter=True)phon_distance=PhoneticsInnerLanguageDistance(soundex)phon_distance.distance('ёлочка','йолочка')...0
  1. 你也可以计算两种语言的单词之间的距离。这将有助于与一个语言家庭小组合作。
fromfonetika.distanceimportPhoneticsBetweenLanguagesDistancem1=FinnishMetaphone(reduce_word=False)m2=EstonianMetaphone(reduce_word=False)phon_distance=PhoneticsBetweenLanguagesDistance(m1,m2)phon_distance.distance('yö','öö')...1

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
如何用java表示这个数学函数的算法   Java/Stream帮助:仅使用streams将嵌套的映射列表转换为映射   使用Selenium连接到数据库时发生java未知主机异常   java如何了解jvm内存使用:“堆内存”和“堆外内存”   java Oracle BI报告导入模板   java如何使用Spring将xml转换为bean?   java线程。join()以保证执行顺序   java从THINGSPEAK到ANDROID应用程序获取JSON数据   使用Java的stanford库中的异常   java正确使用来自其他类文件的方法   如果集合中的元素类型为接口类型,如何填充集合?(爪哇)   记录java。util。记录器创建的文件超过了应有的数量   类Java对象uniq值   尝试调用无法应用于()的方法时出现java错误