古汉语语音分析工具。
dphon的Python项目详细描述
直接
早期汉语文本中的数字互文共振
使用pip安装: direct的基本功能是对两个早期汉语文本进行语音比较。您需要将文件以utf-8编码的纯文本( 输出将是文本a中的字符序列列表,其中有文本b中的押韵对应项,包括用于绘制序列的文本和行号: 请注意,序列忽略非单词字符,包括标点和数字。这意味着押韵可以跨越行,这将反映在输出中。 您可以使用以下命令查看命令选项的完整列表: 匹配序列由一个字典文件决定,该文件代表旧汉语音韵学的特定重建(您可以在 direct的核心过程是接受纯文本输入,根据特定的语音重构对其进行标记化,并在标记化文本中搜索匹配项。因此,这些匹配代表了共鸣:尽管它们的书面形式不同,但最初朗读时可能押韵的序列。 python>;=3.6是必需的。 首先,克隆存储库: 然后,创建并激活虚拟环境(推荐): 安装依赖项: 最后,在开发模式下安装包本身: 现在,当您运行 pull请求应该针对 单元测试是用pytest编写的。您可以使用以下命令运行它们: 确保 如果在较旧版本的 要为发行版构建源存档和分发,请执行以下操作: 在test PyPI上发布发行版(对于确保一切正常工作非常有用): 如果一切正常,请将包发布到pypi:安装
$ pip install dphon
用法
.txt
)格式保存在本地。比较两个文本:$ dphon text_a.txt text_b.txt # search text b against text a
滋章盜賊多有 (a: 16)# this sequence of characters from a line 16 matches
滋彰,盜賊多有 (b: 57)# this sequence of characters from b line 57
...
不可得 (a: 15)# this sequence from a on line 15 matches two separate
不可識 (b: 15)# locations in b, and both of them are on line 15 in b
不可識 (b: 15)
...
解其忿 (a: 15)# in this sequence, we see three separate graphic
解其紛 (b: 4)# variations for the third character - one on a line 15
解其分 (b: 56)# and two from b on lines 4 and 56
$ dphon --help
方法论
data/
文件夹中看到一些示例)。这些数据结构将输入字符映射到可与其他此类令牌匹配的任意声音令牌(“虚拟”)。开发设置
$ git clone https://github.com/direct-phonology/direct.git
$ cd direct
$ python -m venv venv
$ source venv/bin/activate
$ pip install -r requirements.txt
$ pip install -r dev-requirements.txt
$ pip install -e .
dphon
时,您的更改将被自动获取。develop
分支发出。测试
$ pytest
释放量
dphon/__init__.py
中的版本号正确!dist/
中有任何内置文件,请在
开始此过程:$ rm dist/*
$ python setup.py sdist bdist_wheel
$ twine upload --repository-url https://test.pypi.org/legacy/ dist/*
$ twine upload dist/*
推荐PyPI第三方库