所以我试图从PubMed搜索中从每篇文章中以AMA格式获取所有引用。以下代码仅用于获取第一篇文章中的引用数据
import requests
import xlsxwriter
from bs4 import BeautifulSoup
URL = 'https://pubmed.ncbi.nlm.nih.gov/?term=infant+formula&size=200'
response = requests.get(URL)
html_soup = BeautifulSoup(response.text, 'html5lib')
article_containers = html_soup.find_all('article', class_ = 'labs-full-docsum')
first_article = article_containers[0]
citation_text = first_article.find('div', class_ = 'docsum-wrap').find('div', class_ = 'result-actions-bar').div.div.find('div', class_ = 'content').div.div.text
print(citation_text)
脚本返回一个空行,即使当我通过Google Chrome检查源代码时,文本在该“div”中清晰可见
这与JavaScript有关吗?如果是,我如何修复它
此脚本将从提供的URL获取“AMA”格式的所有引用:
印刷品:
相关问题 更多 >
编程相关推荐