gskrawler将进入您的域名,扫描您网站的每一页,提取页面标题、描述、关键字和链接等。

gskrawler的Python项目详细描述


gskrawler将进入您的域并扫描您网站的每个页面,提取页面标题、描述、关键字和链接等。
----





description:gskrawler将进入您的域并扫描您网站的每个页面,提取页面标题、说明、关键字和链接等。


要求
======================
Beautifulsoup4
请求
urllib3 1.22



命令
============
<;head>;
——


gskrawler.head(url)

<;title>;
——


gskrawler.title(url)

<;body>;
----



----



类名)

----



————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————gskrawler.head('https://www.fisglobal.com/')
>;>gskrawler.tagclass('https://www.naukri.com/','ul','set')

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java使用split函数分割字符串,但没有得到期望的结果   未找到包含derby数据库嵌入架构的sql Java桌面应用程序错误   java elasticsearch vs solr用于定制全文搜索系统   java Android:创建没有startOffset的动画延迟?   java如何查看其他应用程序接收的数据?   java如何在Linux中使用D和classpath选项运行jar文件   java和域设计最佳实践   具有相同内存位置的java数组,将显示为输出   连接到java中的elasticsearch?   Java Playframework重定向到带有Json负载的外部url   java无法在Android平台上使用InputStream为蓝牙socket创建ObjectInputStream   使用POI将Excel日期转换为Java日期,年份未正确显示   oracle从数据库层还是Java层调用webservice?