确定罗马化的日文名字是否是姓氏
myouji-kenchi的Python项目详细描述
关于
这个图书馆识别(Kenchi)罗马化的日本姓氏(Myouji)。 主要是为了把罗马化的日文名字分成名字和姓氏。
用法
>>> import myouji_kenchi >>> myouji_kenchi.order_names(['Yamada', 'Satoshi']) ['Satoshi', 'Yamada'] >>> myouji_kenchi.get_score_as_myouji('Yamada') 201046.0 >>> myouji_kenchi.get_score_as_myouji('Satoshi') 329.0 >>> transliterator = myouji_kenchi.MyoujiBackTransliteration() >>> transliterator.back_transliterate('Yamada') [('ヤマダ', 201046.0)]
背景
名字的日语顺序是family name
given name
,
而西方的顺序是given name
family name
。
当名字是用日文写的时候
我们可以假设它遵循那个惯例。
然而,
当日文名字是用拉丁字符写的
可能是按两种顺序,
取决于上下文和作者。
有时一个人的名字可以被看作是原子的,
人们通常希望知道哪个名字是哪个。
一个主要的复杂情况是各种各样的罗马化方案在积极使用。 大多数从拉丁字符到日文的反译库 前提是已知原音译的罗马化方案。 通常在这种情况下 你不知道日文名字的顺序 罗马化计划也将不得而知。 这个图书馆的目标是Kunrei Shiki,Nihon Shiki和(改良的)Hepburn, 考虑到 省略了宏和撇号。
安装/依赖项
安装OpenFst。
有必要 openfst的版本和openfst python绑定的版本匹配。 注意openfst必须使用
--enable-far
选项编译 为了支持绑定包。wget http://www.openfst.org/twiki/pub/FST/FstDownload/openfst-1.6.6.tar.gz tar xf openfst-1.6.6.tar.gz cd openfst-1.6.6 ./configure --enable-far make sudo make install
pip安装myouji kenchi
pip install myouji-kenchi
在OSX上编译OpenFST可能会很麻烦。
确保您有最新版本的编译器和
前缀^ {< CD6> }和/或^ {CD7}}
使用CFLAGS="-std=c++11 -stdlib=libc++"
可能会有帮助。
有关python依赖项,请参见setup.py
和requirements_dev.txt
。
许可证
麻省理工学院许可证(见许可证文件)