无法使用BeautifulSoup刮表

url = 'http://investmentmoats.com/DividendScreener/DividendScreener.php' res = requests.get(url) soup = BeautifulSoup(res.content,'lxml') table = soup.find_all('table')[0] df = pd.read_html(str(table))[0]

2条回答

网友

1楼 · 编辑于 2024-06-16 12:57:52

尝试以下操作：

url = 'http://investmentmoats.com/DividendScreener/DividendScreener.php'
res = requests.get(url)
soup = BeautifulSoup(res.text, 'lxml')
for row in soup.find('table').find_all('tr'):
    print(' '.join([x.text for x in row.find_all('td')]))
    # Or just use '[x.text for x in row.find_all('td')]' in your data frame.

部分输出：

^{pr2}$

编辑：如上述程序中的注释所述，要将数据存储在数据框中，只需创建列表并将其添加到数据框中即可。在

^{3}$

网友

2楼 · 编辑于 2024-06-16 12:57:52

您可以尝试以下方法：

>>> from urllib.request import Request, urlopen
>>> from bs4 import BeautifulSoup
>>> url = 'http://investmentmoats.com/DividendScreener/DividendScreener.php'
>>> req = Request(url,headers={'User-Agent': 'Mozilla/5.0'})
>>> webpage = urlopen(req).read()
>>> soup = BeautifulSoup(webpage, "html.parser")
>>> required = soup.find_all("table", {"class":"securityTable"})
>>> x = []
>>> for i in required:
...     x.append(i.get_text())
>>> for i in x:
...     print(i)

相关问题更多 >

编程相关推荐

热门问题

热门文章

无法使用BeautifulSoup刮表

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >