在BeautifulSoup中提取锚标签之间的文本？

1 投票

1 回答

1300 浏览

提问于 2025-04-18 06:57

我正在尝试从这个fandango页面提取电影的名称。

names_tag = soup.findAll('a', {'class': 'dark showtimes-movie-title'})

这些电影名称被放在一个叫做“anchor class”的地方。问题是，当我运行代码时，输出结果是：

<a class="dark showtimes-movie-title" href="http://www.fandango.com/godzilla3d_170083/movieoverview">Godzilla 3D</a>

而我只想要“哥斯拉3D”的名字。我该如何正确地解析这些数据呢？

#anchor element containing the names of each movie
names_tag = soup.findAll('a', {'class': 'dark showtimes-movie-title'})
names_tag = str(names_tag)

movie_name = names_tag.split(',')

for each_line in movie_name:
    movie_names.append(each_line)

i = 0
while (i < len(movie_names)):

    print 'The length of %s is %s' %(movie_names[i], movie_times[i])

    i+=1

数据解析网页抓取 html解析 beautifulsoup 锚标签

1 个回答

使用 text 属性：

names_tag = soup.findAll('a', {'class': 'dark showtimes-movie-title'})
names = [name_tag.text for name_tag in names_tag]

回答于 2025-04-18 由 Python大师

分享举报

在BeautifulSoup中提取锚标签之间的文本？

1 个回答

撰写回答