从网页中的文章获取标题和正文文本
htmltext的Python项目详细描述
修补的错误
主页:https://github.com/robin zhang whycoding/htmlext
作者:robin zhang
作者电子邮件:whycoding@outlook.com
许可证:未知
描述:htmlext
===
htmlext是一个简单的工具,可以获取html网页中文章的正文,如新闻,bolg.etc.
安装:
----
pip install htmlext
用法:
----
from htmlext import htmlext
title,text=htmlext(html数据)
示例:
——
import requests
from htmlext import htmlext
r=requests.get(文章的URL)
title,text=htmlext(r.content)
print(title)
print(text)
平台:未知
分类器:目标受众::开发人员
分类器:许可证::OSI批准::MIT许可证
分类器:编程语言::Python
分类器:编程语言::Python::2
分类器:编程语言::Python::3
分类器:主题::软件开发::库:python模块
分类器:操作系统::操作系统无关
描述内容类型:文本/标记
主页:https://github.com/robin zhang whycoding/htmlext
作者:robin zhang
作者电子邮件:whycoding@outlook.com
许可证:未知
描述:htmlext
===
htmlext是一个简单的工具,可以获取html网页中文章的正文,如新闻,bolg.etc.
安装:
----
pip install htmlext
用法:
----
from htmlext import htmlext
title,text=htmlext(html数据)
示例:
——
import requests
from htmlext import htmlext
r=requests.get(文章的URL)
title,text=htmlext(r.content)
print(title)
print(text)
平台:未知
分类器:目标受众::开发人员
分类器:许可证::OSI批准::MIT许可证
分类器:编程语言::Python
分类器:编程语言::Python::2
分类器:编程语言::Python::3
分类器:主题::软件开发::库:python模块
分类器:操作系统::操作系统无关
描述内容类型:文本/标记