未提供项目说明

mapling的Python项目详细描述



映射

地图绘制可以在文本中找到一些东西,比如地名。它返回一个csv文件,其中包含一行。对于每个文件,它会创建一个突出显示的html页面。只需将映射指向一个装满文档的文件夹。映射使用textract从许多类型的文件中提取文本,包括csv、doc、docx、pdf、html、txt和许多其他文件。在

用法:$ mapling texts/ --gazetteer=gazetteer/gazetteer.txt --model=de_core_news_sm --html 要安装spaCy model$ python -m spacy download de_core_news_sm

  • 第一种方法是使用地名录。Mapling需要一个txt文件,每个地名对应一行。 添加--gazetter参数和文件的路径。这种方法允许您搜索文本中出现的特定术语(不仅仅是位置)。 $ mapling /dir/with/txt_files --gazetteer="/home/me/gazetter.txt"

  • 第二种方法使用空间命名实体识别模型。使用添加--model参数 已安装空间模型的名称。如果您的型号未安装或未安装 有一个ner管道,你会得到如何修复的指示。这种方法将返回大量的实体和位置,比您自己列出的要多。这有助于确定文本中出现的地点、人员和组织。 $ mapling /dir/with/txt_files --model=de_core_news_md

  • 最后,映射可以创建可视化。添加--html参数 $ mapling /dir/with/txt_files --model=de_core_news_md --html

要安装:

pip install mapling

在未来,地图绘制还将与Word Historical Gazetteer一起工作,以纠正、地理编码和绘制您的地名。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java log4j找不到log4jtest。房产?   我在java线程“awteventque1”中获得异常。lang.NullPointerException   java为什么在使用完整路径从文件系统读取文件时出错?   java如何迭代所有注册表项?   java中的安卓 Opencv SVM未正确训练   多线程Java ThreadPoolExecutor关闭特定线程?   如何使用Java NIO CreateDirectory方法设置目录所有者组?   java NatTable混合了固定宽度的列和可调整大小的填充剩余空间   java如何删除特定网络,即使该网络是由安卓上的其他设备创建的?   java Guava toJavaUtil()不存在   java对许多常量使用枚举是有效的memorywise?   java是否可以使用坐标定位JButton?   从WSDL生成java代码导致异常   java如何在安卓中导出javadoc   爬行JAX中的java NoClassDefFoundError错误   java为片段中的文本视图设置区域设置   发送最后一条消息后发生Java RMI RemoteException