如何从网上搜集一位作者在谷歌学者上每年每篇论文的引文数量?

2024-06-09 00:07:21 发布

您现在位置:Python中文网/ 问答频道 /正文

我想画一个柱状图,显示一个谷歌学者作者的h指数在每年的变化。为了计算这一点,我需要每年每篇论文的引文数和每年的h指数。在

我已经在作者简介页面上找到了这个图表。以阿尔伯特·爱因斯坦的谷歌学者为例https://scholar.google.com/citations?user=qc6CJjYAAAAJ&hl=en,我在右边得到了每年的引用次数图表,但这是不正确的。我真正想要的是,当你点击一篇论文时,会有一个按年份排列的总引用率图表。我在Python中使用beauthoulsoup和selenium包。我现在最大的困难是: 如果你检查一个作者的html代码,每篇论文的内容都是隐藏的,如何通过点击每篇论文,并按年度获取每篇论文的总引文数图表?在

这是我为右边的图表所做的

def get_citation_by_year(url):
    s = soup(str(urllib.request.urlopen(url).read()), 'lxml')
    print(s)
    #print(s.title.text) #whose google scholar is this?
    years = list(map(int, [i.text for i in s.find_all('span', {'class':'gsc_g_t'})]))
    citation_number = list(map(int, [i.text for i in s.find_all('span', {'class':'gsc_g_al'})]))
    final_chart_data = dict(zip(years, citation_number))
    df = pd.DataFrame({'Year': years, 'Cited_By': citation_number})
    return(df)

单击showmore按钮以显示最大文章数:

^{pr2}$

其他工具尝试:R“学者”包,没有每年每篇论文的引文计数,只有每年的引文计数。 Windows应用程序:发布或消亡(相同的问题)。 scopusapi(没有作为google学者的作者的所有文章的完整列表)


Tags: texturlnumbermapgoogle图表作者指数