2024-05-14 22:14:41 发布
网友
我想从以下学院网站https://java.access.uni.edu/ed/faces/searchStudent.jsp访问所有学生的详细信息 我不知道学生的名字,我想了解每个学生的详细情况。 目录是打开的,里面没有非法内容。 我使用以下github代码作为参考。 https://github.com/JoshuaRLi/direktory/blob/master/direktory.py 请帮忙!在
您可以使用bs4 beautifulsoup来完成,这将帮助您从给定的目录中删除内容。。。它基本上被称为网页抓取。。在
bs4 beautifulsoup
这就是你的github链接所代表的。。。在
另一个方法是,selenium webdriver。。 通过这个方法,您可以简单地传递url,然后给出相应的字段名及其值。在
您可以从selenium本身触发API URL。。。在
另外,您可以使用python请求的方法发送POST请求并直接获得响应。。。在
示例如下:
>>> import requests >>> r = requests.post("https://java.access.uni.edu/ed/faces/searchStudent.jsp;jsessionid=e8093da105003620293edb31ec442edfdfa514485389b950c4f20b46515aa640.e34Sbx0MaNuObi0LahiMaxmRb30Re0", data={'txtLastName':'mohamemd','txtFirstName':'mohideen','txtEmail':'temp@mail.com','soMajor':0,'soCollege':0,'soClass':0}) >>> r.status_code 200 >>> r.text[:300] u'<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"\r\n"http://www.w3.org/TR/html4/loose.dtd">\r\n\r\n\r\n\r\n\r\n\r\n\r\n <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/loose.dtd"><html dir="ltr" lang="en-US">\r\n <head id="head1"><title>UNI Directory - Student Search</t' >>> a = r.text[:300] >>> len(a) 300 >>>
这里我把输出限制在300。。如果你想要满的,你可以直接打印
您可以使用
bs4 beautifulsoup
来完成,这将帮助您从给定的目录中删除内容。。。它基本上被称为网页抓取。。在这就是你的github链接所代表的。。。在
另一个方法是,selenium webdriver。。 通过这个方法,您可以简单地传递url,然后给出相应的字段名及其值。在
您可以从selenium本身触发API URL。。。在
另外,您可以使用python请求的方法发送POST请求并直接获得响应。。。在
示例如下:
这里我把输出限制在300。。如果你想要满的,你可以直接打印
^{pr2}$相关问题 更多 >
编程相关推荐