在同一类中返回单独的文本

import bs4, pandas as pd, re from datetime import datetime from selenium import webdriver from selenium.common.exceptions import NoSuchElementException from selenium.webdriver.common.keys import Keys driver = webdriver.Chrome(r'C:\Users\grant\PythonScripts\chromedriver.exe') url = ('https://www.sportsbookreview.com/betting-odds/mlb-baseball/?date=' + betDate) # Full MLs driver.get(url) fullML = driver.page_source driver.quit() fullMLsoup = bs4.BeautifulSoup(fullML, 'html.parser') x = [el.text.strip() for el in fullMLsoup.find_all(re.compile(r'div'), {'class':"_1Y3rN _308Yc"})] print(x)

1条回答

网友

1楼 · 发布于 2024-05-14 03:01:47

您可以在bs4 4.7.1中使用第n个子级和第一个子级。这是最后两列

import requests
from bs4 import BeautifulSoup as bs

r = requests.get('https://www.sportsbookreview.com/betting-odds/mlb-baseball/money-line/?date=20171029')
soup = bs(r.content, 'lxml')
top = [item.text for item in soup.select('._308Yc div:first-child')]
bottom = [item.text for item in soup.select('._308Yc div:nth-child(2)')]
print(top, bottom)

您可以通过regex以json的形式获取所有内容，然后解析json。探索jsonhere

import requests
import re
import json
r = requests.get('https://www.sportsbookreview.com/betting-odds/mlb-baseball/money-line/?date=20171029')
p = re.compile(r'window.__INITIAL_STATE__=(.*?);\n', re.DOTALL)
data = json.loads(p.findall(r.text)[0])

相关问题更多 >

编程相关推荐

热门问题

热门文章