Python verbaendeliste-bundestag包_程序模块 - PyPI

解析pdf到xml转换的德国联邦议院大厅列表

verbaendeliste-bundestag的Python项目详细描述

使用pdftohtml从pdf中获取xml文件。

pdftohtml -xml input.pdf output.xml

然后使用带有第一个和最后一个相关页码的提取器将其转换为已解析的json:

python extract_lobby.py 4 690 < lobbylist.xml > lobbylist.json

这里是[提取的json（2012年6月15日）]（http://stefanwehrmeyer.com/projects/verbaendeliste/20120615.json）。

许可证：麻省理工学院许可证

欢迎加入QQ群-->： 979659372

推荐PyPI第三方库

热门话题: 当注释bean用作另一个bean中的集合时，java自定义约束验证器不工作毕加索中的java错误get（）无法应用于（安卓.content.Context） java RSA Encryption生成带有“\n”字符的字符串，我无法解密 java使用无线路由器访问Wamp java EhCache磁盘持久性可以持久化任意对象将文件复制到数组（Java） Java JScience：如何打印整个实数？用户界面在JAVA中鼠标点击“设置”按钮时如何获取文本字段内容 JAVA中ArrayList<ArrayList>的深度副本 eclipse的java代码感知样式自动完成 netbeans 7无法从另一个平台运行java项目 hbm中的java异常。xml java在电子邮件正文中发送HTML 按名称列出的tomcat Java jconsole应用程序在活动之间传递ArrayList的java机制 Java中long的模运算符是什么？

verbaendeliste-bundestag 0.1.0

verbaendeliste-bundestag的Python项目详细描述

推荐PyPI第三方库

clihandler

napalm-ciena-saos

ezexif

bin-gauss-distributions

ibmcloudant

spaceone-plugin

hxlxalgotrt

distributions-robinlamb-test

distrianalysis

certbot-dns-selectel

biondi

wifiqr

nnlist

city-weather

inveniorecordsfiles

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

verbaendeliste-bundestag 0.1.0

verbaendeliste-bundestag的Python项目详细描述

推荐PyPI第三方库

clihandler

napalm-ciena-saos

ezexif

bin-gauss-distributions

ibmcloudant

spaceone-plugin

hxlxalgotrt

distributions-robinlamb-test

distrianalysis

certbot-dns-selectel

biondi

wifiqr

nnlist

city-weather

inveniorecordsfiles

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

导航栏

项目链接

标签