无法在NSE中刮取表格数据

from bs4 import BeautifulSoup import pandas as pd import requests url = "https://www1.nseindia.com/live_market/dynaContent/live_market.htm" webpage = requests.get(url); soup = BeautifulSoup(webpage.content, "html.parser"); for tr in soup.find_all('tr'): advance = tr.find_all('td') print(advance)

1条回答

网友

1楼 · 发布于 2024-06-16 08:54:15

此页面使用JavaScript加载这些信息，但requests/BeautifulSoup无法运行JavaScript

使用DevTools在Chrome/Firefox（tabNetwork，filterxhr）中，我发现JavaScript使用的url将其作为JSON数据加载，所以我甚至不必使用BeautifulSoup来获取它

import requests

url = 'https://www1.nseindia.com/live_market/dynaContent/live_analysis/changePercentage.json'
r = requests.get(url, headers={'User-Agent': 'Mozilla/5.0'})
data = r.json()
print(data['rows'][0]['advances'])
print(data['rows'][0]['declines'])
print(data['rows'][0]['unchanged'])
print(data['rows'][0]['total'])

顺便说一句：没有User-Agent它不会发送数据

相关问题更多 >

编程相关推荐

热门问题

热门文章