Python raspador包_程序模块 - PyPI

从半结构化文本文档中提取数据的库

raspador的Python项目详细描述

https://api.travis-ci.org/fgmacedo/raspador.png?branch=master

https://coveralls.io/repos/fgmacedo/raspador/badge.png

从半结构化文本文档中提取数据的库。

它最适合在没有结构和是纯文本的（或易于转换的）。结构化文件像xml、csv和html一样，不适合raspador的良好用例，并且提取数据的绝佳选择，比如lxml，html5lib， BeautifulSoup，和PyQuery。

提取器通过类定义为模型，类似于 Django Orm公司。每个字段搜索由正则表达式和捕获的组将自动转换为原语。

解析器被实现为一个生成器，其中找到的每个项都可以被使用在分析结束之前，以管道为特色。

分析是向前的，这使得它非常快，因此可以分析返回字符串的迭代器，包括无限流。

安装

拉斯帕多在cpython 2.6+、cpython 3.2+和pypy上工作。要安装它，请使用：

pip install raspador

或易于安装：

easy_install raspador

来源

从源代码下载并安装：

git clone https://github.com/fgmacedo/raspador.git
cd raspador
python setup.py install

依赖性

没有外部依赖项。

注意

python 2.6版

对于python 2.6，必须安装ordereddict。

您可以使用pip安装它：

pip install ordereddict

测试

为了同时使用所有受支持的python版本自动化测试，我们使用tox。

使用以下命令运行所有测试：

$ tox

测试依赖于几个第三方库，但这些库是由tox安装的在每个python的virtualenv上：

nose==1.3.0
coverage==3.6
flake8==2.0

示例

从日志中提取数据

from__future__importprint_functionimportjsonfromraspadorimportParser,StringFieldout="""
PART:/dev/sda1 UUID:423k34-3423lk423-sdfsd-43 TYPE:ext4
PART:/dev/sda2 UUID:74928389-852893-sdfdf-g8 TYPE:ext4
PART:/dev/sda3 UUID:sdkj9d93-sdf9df-3kr3l-d8 TYPE:swap
"""classLogParser(Parser):begin=r'^PART.*'end=r'^PART.*'PART=StringField(r'PART:([^\s]+)')UUID=StringField(r'UUID:([^\s]+)')TYPE=StringField(r'TYPE:([^\s]+)')a=LogParser()# res is a generatorres=a.parse(iter(out.splitlines()))out_as_json=json.dumps(list(res),indent=2)print(out_as_json)# Output:"""
[
  {
    "PART": "/dev/sda1",
    "TYPE": "ext4",
    "UUID": "423k34-3423lk423-sdfsd-43"
  },
  {
    "PART": "/dev/sda2",
    "TYPE": "ext4",
    "UUID": "74928389-852893-sdfdf-g8"
  },
  {
    "PART": "/dev/sda3",
    "TYPE": "swap",
    "UUID": "sdkj9d93-sdf9df-3kr3l-d8"
  }
]
"""

欢迎加入QQ群-->： 979659372

raspador 0.2.2

raspador的Python项目详细描述

安装

来源

依赖性

测试

示例

推荐PyPI第三方库

dogslow

aionotif

odoo11-addon-website-sale-secondary-unit

Experimentor

configureme

knowyourdata

penelope.trac

metaheuristic

offline-judge

systemfixtures

odoo9-addon-stock-quant-manual-assign

game-starter

zops

labkit

scraperwiki

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

raspador 0.2.2

raspador的Python项目详细描述

安装

来源

依赖性

测试

示例

推荐PyPI第三方库

dogslow

aionotif

odoo11-addon-website-sale-secondary-unit

Experimentor

configureme

knowyourdata

penelope.trac

metaheuristic

offline-judge

systemfixtures

odoo9-addon-stock-quant-manual-assign

game-starter

zops

labkit

scraperwiki

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

导航栏

项目链接

标签