一个方便处理(不仅是)带有spacy的tei文档的包

acdh-spacytei的Python项目详细描述


acdh spacy tei是一个python包,提供实用程序类和函数来处理带有/用于spacy的xml(tei,tcf)编码文档

安装

pip安装acdh spacytei

许可

除非另有说明,否则所有代码均根据麻省理工学院许可证(MIT)的条款获得许可。请参阅此存储库根目录中的文件许可证。

历史记录

0.0.9(2019-02-27)

  • 添加了处理神童输出文件的函数
  • pipline处理访问模型dir

0.0.6(2019-02-27)

  • 向teireader添加了标记化方法
  • 作为rs标记写入tei的ne信息
  • 小事

0.0.6(2019-02-27)

  • 添加要安装的langid需要
  • 添加了新功能
  • 小事

0.0.3(2019-02-25)

  • 小事

0.0.1(2019-02-25)

  • 第一个版本

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Java:不解析XML的简单XML。例外   KIE Workbench的java自定义UI   java将元素从bucket移动到LinkedList,但有一个元素被完全删除   如何将java stream collect转换为scala   java运行AsynkTask多次不工作   java组织。xml。萨克斯。SAXParseException:cvccomplextype。2.4.c:匹配的通配符是严格的   java是一种计算排序算法所需时间的合适方法   java在O(logn)时间内对排序整数数组中具有相同数字的数字进行计数   xpages从当前数据库javaAgent调用另一个数据库的javaAgent   java如何在instagram中上传特定位置的所有照片   JavaApachePOI可以有效地删除多个列   java创建的对象数   java我可以在关闭连接时关闭Oracle JDBC自动提交吗?