确定罗马化的日文名字是否是姓氏

myouji-kenchi的Python项目详细描述


关于

这个图书馆识别(Kenchi)罗马化的日本姓氏(Myouji)。 主要是为了把罗马化的日文名字分成名字和姓氏。

用法

>>> import myouji_kenchi
>>> myouji_kenchi.order_names(['Yamada', 'Satoshi'])
['Satoshi', 'Yamada']
>>> myouji_kenchi.get_score_as_myouji('Yamada')
201046.0
>>> myouji_kenchi.get_score_as_myouji('Satoshi')
329.0
>>> transliterator = myouji_kenchi.MyoujiBackTransliteration()
>>> transliterator.back_transliterate('Yamada')
[('ヤマダ', 201046.0)]

背景

名字的日语顺序是family namegiven name, 而西方的顺序是given namefamily name。 当名字是用日文写的时候 我们可以假设它遵循那个惯例。 然而, 当日文名字是用拉丁字符写的 可能是按两种顺序, 取决于上下文和作者。 有时一个人的名字可以被看作是原子的, 人们通常希望知道哪个名字是哪个。

一个主要的复杂情况是各种各样的罗马化方案在积极使用。 大多数从拉丁字符到日文的反译库 前提是已知原音译的罗马化方案。 通常在这种情况下 你不知道日文名字的顺序 罗马化计划也将不得而知。 这个图书馆的目标是Kunrei Shiki,Nihon Shiki和(改良的)Hepburn, 考虑到 省略了宏和撇号。

安装/依赖项

  1. 安装OpenFst

    有必要 openfst的版本和openfst python绑定的版本匹配。 注意openfst必须使用--enable-far选项编译 为了支持绑定包。

    wget http://www.openfst.org/twiki/pub/FST/FstDownload/openfst-1.6.6.tar.gz
    tar xf openfst-1.6.6.tar.gz
    cd openfst-1.6.6
    ./configure --enable-far
    make
    sudo make install 
    
  2. pip安装myouji kenchi

    pip install myouji-kenchi
    

在OSX上编译OpenFST可能会很麻烦。 确保您有最新版本的编译器和 前缀^ {< CD6> }和/或^ {CD7}} 使用CFLAGS="-std=c++11 -stdlib=libc++"可能会有帮助。

有关python依赖项,请参见setup.pyrequirements_dev.txt

许可证

麻省理工学院许可证(见许可证文件)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何显示因用户而异的SQLite存储数据?   转换java。sql。将映射传递给Jackon的valueToTree方法时StringNode的时间戳   从java中的列表json获取值   unicode Java字符存储在什么编码中?   java如何让Spring数据存储库中的默认方法命中缓存?   java使用readClassDescriptor()和resolveClass()来允许序列化版本控制   数组通过另一个矩阵的一部分填充矩阵   如果包含使用正则表达式的字符串,则替换父XML标记的java   java清除SharedReference中的单个变量   java将变量值从一个jsp页面传输到另一个jsp页面   java JDBC+SQLite:DriveManager不加载所需的驱动程序   相同源代码的java Kotlin构建生成不同的二进制文件   Java中的元组枚举