安全地登录到web服务器并从HTML中提取数据的程序

1条回答

网友

1楼 · 发布于 2024-05-16 13:31:45

scrapy已经在评论中提到，这是进一步研究使用python进行刮取的第一个好提示。就我个人而言，我更喜欢直接用pycurl和BeautifulSoup编程，但这是一个品味问题

关于授权，您应该调查您将要删除的网站是否支持Basic身份验证。如果是这样，您可以轻松地在头中传递user/password（这在pycurl中很简单，这就是我喜欢它的原因）。如果需要Form based登录，身份验证将需要更多的编码。祷告没有人坚持要证书。。。在任何情况下，您都应该小心地确保使用https而不是http，以避免通过互联网发送您的可自由读取的密码

编程相关推荐

java读取SSLSocket的最快或最佳方式
JavaGuice向类构造函数注入对象
java类不是抽象的，并且不会覆盖OnClickListener中的抽象方法onClick（视图）
java OpenGL 1.1更改颜色更改以前的颜色？
c#将Java/Android连接到。网络服务
java在节点上生成AES密钥
java Liferay与MarkLogic XDBC数据库集成
java使用静态初始化块来提高性能
java如何在需要不同参数的另一个方法中使用同一类中的方法
音频Java多种声音

相关问题更多 >

编程相关推荐

热门问题

热门文章

安全地登录到web服务器并从HTML中提取数据的程序

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >