如何从IMDB网站上获取电影信息?

2024-05-19 19:48:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我是Python新手,正在尝试清理IMDB。我正在抓取一个250部IMDB顶级电影的名单,并想获得关于每个独特网站的信息,例如每部电影的长度。在

我已经有一个独特的网址列表。所以,我想循环查看这个列表,对于这个列表中的每个URL,我想检索电影的“长度”。这能用一个代码实现吗?在

for URL in urlofmovie:
    htmlsource = requests.get(URL)
    tree_url = html.fromstring(htmlsource)
    lengthofmovie = tree_url.xpath('//*[@class="subtext"]')

我希望lengthofmovie将成为所有电影长度的列表。但是,它已经在第2行出错了:htmlsource。在


Tags: 代码信息treeurl列表电影网站顶级
1条回答
网友
1楼 · 发布于 2024-05-19 19:48:00

要使其成为一个列表,您应该首先创建一个列表,然后将每个长度附加到该列表中。在

length_list = []
for URL in urlofmovie:
    htmlsource = requests.get(URL)
    tree_url = html.fromstring(htmlsource)
    length_list.append(tree_url.xpath('//*[@class="subtext"]'))

小提示:既然您是Python的新手,我建议您先复习一下PEP8 conventions。变量命名可以使您(和其他开发人员)的工作更轻松。(urlofmovie->;电影的url\u)

However, it already goes wrong for at line 2: the htmlsource.

请提供您收到的例外情况。在

相关问题 更多 >