我正在尝试学习如何使用beauthoulsoup+python进行web垃圾搜索,我想从https://letterboxd.com/film/donnie-darko/中获取电影摄影师的名字,但我不知道如何隔离文本。我想要的html是这样写的,我想输出的是“Steven Poster”:
<h3><span>Cinematography</span></h3>
<div class="text-sluglist">
<p>
<a href="/cinematography/steven-poster/" class="text-slug">Steven Poster</a>
</p>
</div>
在我的代码范围内我已经做到了汤。找(text=“Cinemaography”),以及各种不同的东西的混合,比如试图从a和p标记中找到项目或获取_文本,但是。。。在
我将使用正则表达式来解析soup对象以获取包含“电影摄影”的链接。在
使用CSS部分文本选择器:
也可以在不使用regex的情况下执行相同的操作:
输出:
^{pr2}$相关问题 更多 >
编程相关推荐