从网页中的文章获取标题和正文文本

htmltext的Python项目详细描述


修补的错误
主页:https://github.com/robin zhang whycoding/htmlext
作者:robin zhang
作者电子邮件:whycoding@outlook.com
许可证:未知
描述:htmlext
===
htmlext是一个简单的工具,可以获取html网页中文章的正文,如新闻,bolg.etc.


安装:
----
pip install htmlext


用法:
----
from htmlext import htmlext

title,text=htmlext(html数据)

示例:
——
import requests
from htmlext import htmlext

r=requests.get(文章的URL)
title,text=htmlext(r.content)
print(title)
print(text)




平台:未知
分类器:目标受众::开发人员
分类器:许可证::OSI批准::MIT许可证
分类器:编程语言::Python
分类器:编程语言::Python::2
分类器:编程语言::Python::3
分类器:主题::软件开发::库:python模块
分类器:操作系统::操作系统无关
描述内容类型:文本/标记

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
NetBeans中的Java Swing滚动窗格   java如何与具有复合键的表建立关系?   Android中读取文件时java数据丢失   java黄瓜场景。embed在ubuntu机器上不工作?   java从spring mvc控制器操作中,我如何获得请求/响应的访问权限?   java减去两个长值   java选择下一个值firebase 安卓   用于起始和结尾连字符的java正则表达式   Java正则表达式解释   java Lifefay freemarker ADT:方法不可用?   java我怎样才能让我的开关盒作用于JFrame?   java在我的场景中使用连接池的理想方式是什么   java我如何接受jsoup的cookies?   java如何将整数数组更改为字符串数组?   java Android操作\u指针\u向上直到剩余触摸移动时才调用   java为什么gradle会出错?   io如何在java中复制/拆分输入流?   java使JButton不可见,但尊重其原始空间   java Spring提交表单获取复选框值不起作用