将基本HTML转换为DraftJS JSON格式。
html-to-draftjs的Python项目详细描述
安装
pip install html-to-draftjs
用法
fromhtml_to_draftjsimporthtml_to_draftjsjson=html_to_draftjs(""" <h1>My Page</h1> <h2>Introduction</h2> <p>Some <em>content</em> that is pretty <strong>interesting</strong></p> <p>Don't forget to <a href="https://example.com">follow me!</a></p> <h2>Illustration</h2> <p><img src="https://example.com/image.png" alt="image" /></p>""")
API
html_to_draftjs(raw_html_content: str[, features="lxml", strict=False]) -> dict
将给定的HTML输入转换为JSON
features
HTML树生成器的功能默认情况下,它被设置为lxml
,这是快速和强大的。strict
(布尔值),如果为false,则只在无效操作时发出警告如果是真的,就会引起错误
soup_to_draftjs(bs_object: BeautifulSoup[, strict=False]) -> dict
将给定的漂亮汤转换为json。如果您必须选择HTML内容的给定部分来转换它(例如#content
),则会很有用。
strict
(布尔值),如果为false,则只在无效操作时发出警告。如果是真的,就会引起错误。
支持的标记和属性
块
<div>
,<p>
<h1>
<h6>
<blockquote>
<li>
和<ol>
(不支持<ul>
分组)- 不支持
align
属性。
内联样式
<strong>
,<b>
<em>
,<i>
实体
<img src="url" [alt="alt"] [height="123"] [width="123"]>
<a href="url">
<br/>
- 不支持
title
和align
属性
开发
./setup.py develop
pip install -r requirements_dev.txt