苏美尔命名实体识别
sumerian-ner的Python项目详细描述
安装
$ pip3 install sumerian-ner
如果你不在 virtualenv 您可能需要将pip3与sudo或--user一起使用。
如果您希望克隆存储库。
$ git clone https://github.com/wwunlp/sner.git
$ cd sner/
$ pip3 install .
用法
如果使用pip3安装sner, 您可以从命令行调用sner。 如果克隆了repo,则可以从repo中运行python3 -m sner。
选项和参数
- -r或--run:运行以下模型之一: ^{TT10}$,^{TT11}$,^{TT12}$,^{TT13}$,^{TT14}$,或^{TT15}$。 或者下列例程之一:analysis,export, export-atf、formatting、over-fit或testing。
- -cf或--config:要使用的配置文件。
- -p或--path:数据目录的路径。
- -c或--corpus:语料库的文件名。
- -a或--attestations:证明的文件名。
- -sr或--seed-rules:种子规则的文件名。
- -i或--iterations:迭代次数。
- -mr或--max-rules:每次迭代的最大规则数。
- -al或--alpha:alpha值。
- -k或--k:k值。
- -nd或--norm-date:启用日期规范化。
- -ng或--norm-geo:启用地名规范化。
- -nn或--norm-num:启用数字规范化。
- -np或--norm-prof:启用职业规范化。
sner将在使用默认值之前检查sner.conf。 sner.conf使用JSON语法。 即--corpus corpus.csv将是"corpus": "corpus.csv"。 如果要更改使用的超参数, 您可以在sner.conf中定义它们。 如果您的sner.conf不在存储库的根目录中, 可以将环境变量SNER_CONF设置为sner.conf的路径。