所以我一直在去一个网站获取NDC代码https://ndclist.com/?s=Solifenacin,我需要获取10位数的NDC代码,但在当前网页上只有8位数的NDC代码,如下图所示
因此,我点击带下划线的NDC代码。并获取此网页
因此,我将这两个NDC代码复制并粘贴到excel工作表中,并对我显示的第一个网页上的其余代码重复此过程。但是这个过程需要很长时间,我想知道Python中是否有一个库可以为我复制和粘贴10位数的NDC代码,或者将它们存储在一个列表中,然后我可以在第一页上完成所有8位数的NDC代码后打印列表。是否有一个更好的图书馆来实现这个过程
编辑<<<&书信电报; 我实际上需要深入到另一个层次,我一直在努力解决这个问题,但我一直失败了,很显然,网页的最后一个层次是这个愚蠢的html表,我只需要表中的一个元素。这是你点击二级代码后的最后一个网页。
这是我的代码,但是一旦我运行它,它将返回一个tr和None对象
url ='https://ndclist.com/?s=Trospium'
soup = BeautifulSoup(requests.get(url).content, 'html.parser')
all_data = []
for a in soup.select('[data-title="NDC"] a[href]'):
link_url = a['href']
print('Processin link {}...'.format(link_url))
soup2 = BeautifulSoup(requests.get(link_url).content, 'html.parser')
for b in soup2.select('#product-packages a'):
link_url2 = b['href']
print('Processing link {}... '.format(link_url2))
soup3 = BeautifulSoup(requests.get(link_url2).content, 'html.parser')
for link in soup3.findAll('tr', limit=7)[1]:
print(link.name)
all_data.append(link.name)
print('Trospium')
print(all_data)
是的,在这种情况下,BeautifulSoup是理想的选择。此脚本将打印页面中的所有10位代码:
印刷品:
编辑:(我也得到描述的版本):
印刷品:
相关问题 更多 >
编程相关推荐