使用python访问web目录

2024-05-14 22:14:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我想从以下学院网站https://java.access.uni.edu/ed/faces/searchStudent.jsp访问所有学生的详细信息 我不知道学生的名字,我想了解每个学生的详细情况。 目录是打开的,里面没有非法内容。 我使用以下github代码作为参考。 https://github.com/JoshuaRLi/direktory/blob/master/direktory.py 请帮忙!在


Tags: httpsgithubaccess网站详细信息java学生学院
1条回答
网友
1楼 · 发布于 2024-05-14 22:14:41

您可以使用bs4 beautifulsoup来完成,这将帮助您从给定的目录中删除内容。。。它基本上被称为网页抓取。。在

这就是你的github链接所代表的。。。在

另一个方法是,selenium webdriver。。 通过这个方法,您可以简单地传递url,然后给出相应的字段名及其值。在

您可以从selenium本身触发API URL。。。在

另外,您可以使用python请求的方法发送POST请求并直接获得响应。。。在

示例如下:

>>> import requests
>>> r = requests.post("https://java.access.uni.edu/ed/faces/searchStudent.jsp;jsessionid=e8093da105003620293edb31ec442edfdfa514485389b950c4f20b46515aa640.e34Sbx0MaNuObi0LahiMaxmRb30Re0", data={'txtLastName':'mohamemd','txtFirstName':'mohideen','txtEmail':'temp@mail.com','soMajor':0,'soCollege':0,'soClass':0})
>>> r.status_code
200
>>> r.text[:300]
u'<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"\r\n"http://www.w3.org/TR/html4/loose.dtd">\r\n\r\n\r\n\r\n\r\n\r\n\r\n  <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/loose.dtd"><html dir="ltr" lang="en-US">\r\n    <head id="head1"><title>UNI Directory - Student Search</t'
>>> a = r.text[:300]
>>> len(a)
300
>>> 

这里我把输出限制在300。。如果你想要满的,你可以直接打印

^{pr2}$

相关问题 更多 >

    热门问题