Python靓汤：针对一个特定的elemen

3条回答

网友

1楼 · 编辑于 2024-06-07 07:49:04

attrs={'class': '...'}需要精确的class属性值（不是组合）。
相反，使用soup.select_one方法按扩展的css规则选择：

from bs4 import BeautifulSoup
import requests

url = 'https://flightmath.com/from-CDG-to-BLR'
html_data = requests.get(url).content
soup = BeautifulSoup(html_data, 'html.parser')

dist = soup.select_one('h2 i.fa-plane + strong')
print(dist.text)   # 4,866

网友

2楼 · 编辑于 2024-06-07 07:49:04

感兴趣的情况下：该值被硬编码到html中（用于飞行速度计算），因此您还可以使用下面的正则表达式输出更精确的值。您可以使用round()获取页面上显示的值。你知道吗

import requests, re

urls = ['https://flightmath.com/from-CDG-to-BOM', 'https://flightmath.com/from-CDG-to-BLR', 'https://flightmath.com/from-CDG-to-IXC']
p = re.compile(r'flightspeed\.min\.value\/60 \+ ([0-9.]+)')
with requests.Session() as s:
    for url in urls:
        print(p.findall(s.get(url).text)[0])

网友

3楼 · 编辑于 2024-06-07 07:49:04

查找具有类名的标记，然后使用find_next（）查找强标记。你知道吗

from bs4 import BeautifulSoup
import requests

url = 'https://flightmath.com/from-CDG-to-BLR'
html_data = requests.get(url).text
soup = BeautifulSoup(html_data, 'html.parser')
dist = soup.find('i',class_='fa-plane').find_next('strong')
print(dist.text)

下面是html的一部分

这是我的密码

相关问题更多 >

编程相关推荐

热门问题

热门文章