这个包可以让你的脚本抓取网站。类似jquery的api。

solidscraper的Python项目详细描述


solid scraper
==


易于使用jquery类api进行web抓取/爬行。它还支持
cookies和自定义用户代理。solidscraper与**python
2和3**.

+----+

1兼容。|
| Ins |
| tal |
| lat |
| ion |
+-----+
| ``p |
| ip |
| ins |
| tal |
| l s |
| oli |
| dsc |
| rap |
| er` |
| ` |
+-----+

2. "“Hello World”示例
--------


获取所有链接的所有URL:

…代码::python

import solidscraper a s ss

doc=ss.load(“https://www.example.com/the/path”)


代码::python

import solidscraper as ss

doc=ss.load(“https://www.example.com/the/path”)

其类是
“info”:

…代码::python

import solidscraper as ss

doc=ss.load(“https://www.example.com/the/path”)

如果您想用python 2运行它们,可以用python 2的print语句替换print()``函数
,或者添加以下导入行作为代码的第一个语句:
``from`future`import print``.




欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
maven字段#getGenericType()抛出java。lang.TypeNotPresentException   用java绘制三角形的几何图形   java无法下载主题和发件人地址(rediff)   java如何使代码线程安全   java在尝试转换FileInputStream中的文件时,我遇到了一个FileNotFound异常   java Moxy和Jackson如何将Json映射到Pojo   在foreach循环中使用BufferedWriter生成新行的java问题   java为什么我的测试在单次执行中运行时间小于1秒,而在maven构建中运行时间大于20秒?   java如何显示下载附件的进度条   了解java rmi的良好实践   .net可以将Java portlet嵌入ASP。网页?   循环如何多次执行Java方法?   java如何确保用户输入在给定的有效范围内?   java单元测试定理   java如何在IntelliJ上运行外部构建项目?   JAVA:试图编写一个检查字符串是否为数字的方法。总是返回错误   javahadoop将特定键的所有map方法生成的所有值都发送到一个reduce方法,对吗?   在java中读取和使用文件