从仅在登录后可用的网站获取受限数据

2024-04-23 15:19:34 发布

您现在位置:Python中文网/ 问答频道 /正文

我一直在尝试从www.trademap.org 导出数据有HS2、HS4和HS6格式。一个HS2分为多个HS4,再进一步分为HS6

我已经能够提取数据的网页上使用美丽的汤。问题是,我想在HS6级的数据,而没有登录数据,直到HS4是唯一可用的

为了解决这个问题,我需要首先从python登录trademap

谁能告诉我怎么可能

我从中得到帮助的代码之一是:

from webbot import Browser 
web = Browser()
web.go_to('www.trademap.org') 
web.click('Login')
web.type('example@gmail.com' , into='ctl00$PageContent$Login1_UserName')

web.type('examplepassword' , into='ctl00$PageContent$Login1_Password' , id='PageContent_Login1_LabelPassword') # specific selection
web.click('ctl00$PageContent$Login1_Button',id='PageContent_Login1_DivButton')

但这对我不起作用


Tags: 数据orgbrowserwebwwwtypeclickinto