用于将HTML表转换为字典列表的Python模块。

table2dicts的Python项目详细描述


https://travis-ci.org/moagstar/table2dicts.svg?branch=master

表2图片

用于将HTML表转换为字典列表的Python模块。

安装

使用pip:从pypi安装

$ pip install table2dicts

从源安装:

$ python setup.py install

使用量

给它一些带有table

的html
>>> table2dicts('''
...    <table>
...         <thead>
...             <tr><th>a</th><th>b</th><th>c</th></tr>
...         </thead>
...         <tbody>
...             <tr><td>1</td><td>2</td><td>3</td></tr>
...             <tr><td>4</td><td>5</td><td>6</td></tr>
...         </tbody>
...    </table>
... ''')
[OrderedDict([('a', '1'), ('b', '2'), ('c', '3')]), OrderedDict([('a', '4'), ('b', '5'), ('c', '6')])]

没有theadtbody,没有问题:

>>> table2dicts('''
...    <table>
...        <tr><th>a</th><th>b</th><th>c</th></tr>
...        <tr><td>1</td><td>2</td><td>3</td></tr>
...        <tr><td>4</td><td>5</td><td>6</td></tr>
...    </table>
... ''')
[OrderedDict([('a', '1'), ('b', '2'), ('c', '3')]), OrderedDict([('a', '4'), ('b', '5'), ('c', '6')])]

当不存在th时,第一行td元素用作头:

>>> table2dicts('''
...    <table>
...        <tr><td>a</td><td>b</td><td>c</td></tr>
...        <tr><td>1</td><td>2</td><td>3</td></tr>
...        <tr><td>4</td><td>5</td><td>6</td></tr>
...    </table>
... ''')
[OrderedDict([('a', '1'), ('b', '2'), ('c', '3')]), OrderedDict([('a', '4'), ('b', '5'), ('c', '6')])]

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
当使用RequestDispatcher时,servlets Java最终没有被调用   java生成对具有可变参数数的方法的调用   java如何使用select子句中的参数化列映射iBATIS的查询?   java无法创建类型为org的插件。阿帕奇。登录中。log4j。果心阿佩德。元素RollingFile的RollingFileAppender   java当子实体和父实体之间存在OneTONE JPA关系时,是否可以将其与父实体一起持久化?   Android上的java Facebook集成fbconnect断开链接   获取方法调用方的java机制   从列表创建Oracle阵列时出现java问题   添加和检索元素的ArrayList的java ArrayList   在java中从字符串中删除无效的XML字符   java如何构建完整生成的maven模块   java如何准确地改变播放所有分辨率midi文件的速度?   shell javac:无效标志:/src/中位_度。ubuntu中的java   java使用从其他类的方法检索到的信息