未提供项目说明

mapling的Python项目详细描述



映射

地图绘制可以在文本中找到一些东西,比如地名。它返回一个csv文件,其中包含一行。对于每个文件,它会创建一个突出显示的html页面。只需将映射指向一个装满文档的文件夹。映射使用textract从许多类型的文件中提取文本,包括csv、doc、docx、pdf、html、txt和许多其他文件。在

用法:$ mapling texts/ --gazetteer=gazetteer/gazetteer.txt --model=de_core_news_sm --html 要安装spaCy model$ python -m spacy download de_core_news_sm

  • 第一种方法是使用地名录。Mapling需要一个txt文件,每个地名对应一行。 添加--gazetter参数和文件的路径。这种方法允许您搜索文本中出现的特定术语(不仅仅是位置)。 $ mapling /dir/with/txt_files --gazetteer="/home/me/gazetter.txt"

  • 第二种方法使用空间命名实体识别模型。使用添加--model参数 已安装空间模型的名称。如果您的型号未安装或未安装 有一个ner管道,你会得到如何修复的指示。这种方法将返回大量的实体和位置,比您自己列出的要多。这有助于确定文本中出现的地点、人员和组织。 $ mapling /dir/with/txt_files --model=de_core_news_md

  • 最后,映射可以创建可视化。添加--html参数 $ mapling /dir/with/txt_files --model=de_core_news_md --html

要安装:

pip install mapling

在未来,地图绘制还将与Word Historical Gazetteer一起工作,以纠正、地理编码和绘制您的地名。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Cassandra复制因子大于节点数   java J2EE JTA事务回滚不适用于OSE Glassfish 4.0(Build 89)   java spring安全预认证用户登录   org的java类文件。反应流。从RxJava编译示例时未找到Publisher?   java在使用dataFormat作为POJO通过Camel调用Web服务时无法设置SOAP标头   Javafx类的java静态实例   java如何防止一个部件在关闭时覆盖另一个部件的位置   sql server无法从我的java代码连接到数据库   java在JList(Swing)中显示带有的ArrayList   从Java中的CXF服务获取WSAddressing数据   使用资产文件夹进行java简单json解析(本地)   java LDAPException未绑定的无效凭据   JavaJSFspring部署到weblogic   JAVA中字符数组中的特定元素排列?   如果脚本位于不同的目录中,则ant不会使用exec标记运行Javashell脚本