美丽的汤提取化学名称

import requests import re from requests import get from bs4 import BeautifulSoup import pandas as pd import numpy as np url = 'https://www.legislation.gov.au/Details/F2020L01255' headers = {"Accept-Language": "EN-AU, en;q=0.5"} results = requests.get(url, headers=headers) soup = BeautifulSoup(results.text, "html.parser") chemicals = [] chems_div = soup.find_all('div', class_='WordSection7')

1条回答

网友

1楼 · 发布于 2024-06-12 11:44:44

试试这个：

import requests
from bs4 import BeautifulSoup

url = 'https://www.legislation.gov.au/Details/F2020L01255'
headers = {"Accept-Language": "EN-AU, en;q=0.5"}
results = requests.get(url, headers=headers)

soup = BeautifulSoup(results.text, "html.parser")
chems_div = soup.find('div', class_='WordSection7')
all_spans = [
    t.getText(strip=True) for t in
    chems_div.find_all("span", {"lang": "EN-AU"})
]

print([w for w in all_spans if w.isupper() and w != "SCHEDULE 4"])

输出：

['ABACAVIR.', 'ABATACEPT.', 'ABIRATERONE ACETATE.', 'ABCIXIMAB.', 'ABEMACICLIB.', 'ACALABRUTINIB.', 'ACAMPROSATE CALCIUM.', 'ACARBOSE.', 'ACEBUTOLOL.', 'ACEPROMAZINE.', 'ACETARSOL.', 'ACETAZOLAMIDE.', 'ACETOHEXAMIDE.', 'ACETYL ISOVALERYLTYLOSIN.', 'ACETYLCARBROMAL.', 'ACETYLCHOLINE.', 'ACETYLDIGITOXIN.', 'ACETYLMETHYLDIMETHYLOXIMIDOPHENYLHYDRAZINE.', 'ACETYLSTROPHANTHIDIN.', 'ACIPIMOX.', '# ACITRETIN.', 'ACLIDINIUM BROMIDE.', 'ACOKANTHERA OUABAIO.', 'ACOKANTHERA SCHIMPERI.', 'ACRIVASTINE.', 'ADALIMUMAB.', 'ADAPALENE.', 'ADEFOVIR.', 'ADIPHENINE.', 'ADONIS VERNALIS.', 'ADRAFINIL.', 'AFAMELANOTIDE.', 'AFATINIB DIMALEATE.'
and so on...

相关问题更多 >

编程相关推荐

热门问题

热门文章

美丽的汤提取化学名称

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >