用于将HTML表转换为字典列表的Python模块。

table2dicts的Python项目详细描述


https://travis-ci.org/moagstar/table2dicts.svg?branch=master

表2图片

用于将HTML表转换为字典列表的Python模块。

安装

使用pip:从pypi安装

$ pip install table2dicts

从源安装:

$ python setup.py install

使用量

给它一些带有table

的html
>>> table2dicts('''
...    <table>
...         <thead>
...             <tr><th>a</th><th>b</th><th>c</th></tr>
...         </thead>
...         <tbody>
...             <tr><td>1</td><td>2</td><td>3</td></tr>
...             <tr><td>4</td><td>5</td><td>6</td></tr>
...         </tbody>
...    </table>
... ''')
[OrderedDict([('a', '1'), ('b', '2'), ('c', '3')]), OrderedDict([('a', '4'), ('b', '5'), ('c', '6')])]

没有theadtbody,没有问题:

>>> table2dicts('''
...    <table>
...        <tr><th>a</th><th>b</th><th>c</th></tr>
...        <tr><td>1</td><td>2</td><td>3</td></tr>
...        <tr><td>4</td><td>5</td><td>6</td></tr>
...    </table>
... ''')
[OrderedDict([('a', '1'), ('b', '2'), ('c', '3')]), OrderedDict([('a', '4'), ('b', '5'), ('c', '6')])]

当不存在th时,第一行td元素用作头:

>>> table2dicts('''
...    <table>
...        <tr><td>a</td><td>b</td><td>c</td></tr>
...        <tr><td>1</td><td>2</td><td>3</td></tr>
...        <tr><td>4</td><td>5</td><td>6</td></tr>
...    </table>
... ''')
[OrderedDict([('a', '1'), ('b', '2'), ('c', '3')]), OrderedDict([('a', '4'), ('b', '5'), ('c', '6')])]

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Java:不解析XML的简单XML。例外   KIE Workbench的java自定义UI   java将元素从bucket移动到LinkedList,但有一个元素被完全删除   如何将java stream collect转换为scala   java运行AsynkTask多次不工作   java组织。xml。萨克斯。SAXParseException:cvccomplextype。2.4.c:匹配的通配符是严格的   java是一种计算排序算法所需时间的合适方法   java在O(logn)时间内对排序整数数组中具有相同数字的数字进行计数   xpages从当前数据库javaAgent调用另一个数据库的javaAgent   java如何在instagram中上传特定位置的所有照片   JavaApachePOI可以有效地删除多个列   java创建的对象数   java我可以在关闭连接时关闭Oracle JDBC自动提交吗?