靓汤找不到这个

2024-04-25 05:30:26 发布

您现在位置:Python中文网/ 问答频道 /正文

Python3-靓汤4

我正试图从网站上解析天气图: https://www.wunderground.com/forecast/us/ny/new-york-city

但当我抓起天气图,但美丽的汤似乎抓住它周围。你知道吗

我对靓汤还不熟悉。我认为它不能抓住这一点,因为它不能解析正在进行的标记,或者填充图形的javascript没有加载,或者BS不能解析(至少我使用它的方式是这样)。你知道吗

就我的代码而言,它非常基本

import requests, bs4
url = 'https://www.wunderground.com/forecast/us/ny/new-york-city'
requrl = requests.get(url, headers={'user-agent': 'Mozilla/5.0'})
requrl.raise_for_status()
bs = bs4.BeautifulSoup(requrl.text, features="html.parser")
a = str(bs)
x = 'weather-graph'
print(a[a.find('x'):])
#Also tried a.find('weather-graph') which returns -1

我已经验证了每一段代码都可以在其他场景中工作。最后一行应该找到这个字符串并打印出之后的所有内容。你知道吗

我试着在图形中和周围制作了很多不同的html片段,但没有得到任何实质性的东西。你知道吗


Tags: 代码httpscom图形citynewwwwrequests
1条回答
网友
1楼 · 发布于 2024-04-25 05:30:26

你可以使用一个API。与页面相同。不知道密钥是否过期。您可能需要对输出进行排序,但可以通过datetime字段进行排序

import requests
r = requests.get('https://api.weather.com/v1/geocode/40.765/-73.981/forecast/hourly/240hour.json?apiKey=6532d6454b8aa370768e63d6ba5a832e&units=e').json()
for i in r['forecasts']:
    print(i)

如果不确定,我会很高兴地更新,告诉你如何建立数据帧和秩序。你知道吗

相关问题 更多 >