如何用python和beautiful soup从html代码中提取一个小时

2024-05-16 03:11:44 发布

您现在位置:Python中文网/ 问答频道 /正文

我对Python和靓汤有点陌生。 有人能帮我解答一下如何从这个html代码中提取一个小时吗

<a class="hour-link fancybox-reservation" href="/47,Lodz/Seans/info/seans/CC527207-4B9C-45CD-812F-3501A647E1B3/dzien/146231/film/16892">12:20</a>

输出应为:12:20

提前谢谢你的回答


Tags: 代码infohtmllinkclasshref小时fancybox
2条回答

您可以尝试:

>>> from bs4 import BeautifulSoup as bs

>>> data = """<a class="hour-link fancybox-reservation" href="/47,Lodz/Seans/info/seans/CC527207-4B9C-45CD-812F-3501A647E1B3/dzien/146231/film/16892">12:20</a>"""

>>> soup = bs(StringIO(data))
>>> a_tag = soup.find_all('a')

>>> a_tag[0]
<a class="hour-link fancybox-reservation" href="/47,Lodz/Seans/info/seans/CC527207-4B9C-45CD-812F-3501A647E1B3/dzien/146231/film/16892">12:20</a>

>>> a_tag[0].text
'12:20'

先看看Soup documentation,然后试着自己制定一个答案。我建议您在示例中查看find_all('a').text功能

相关问题 更多 >