python bs4 get元素不带selenium

1条回答

网友

1楼 · 发布于 2024-04-24 14:39:11

如果你是从我使用的主题弹出窗口寻找

res = soup.findAll("div", {"class": "subjects-skills__item"})

回报是：

<div class="subjects-skills__item">
<h5 class="subjects-skills__label">Subjects</h5>
<ul>
<li>Science</li>
</ul>
</div>,
 <div class="subjects-skills__item">
<h5 class="subjects-skills__label">Skills</h5>
<ul>
<li>Creativity</li>
<li>Critical Thinking</li>
</ul>
</div>

我是通过点击弹出窗口得到的。。突出显示文本，然后右键单击并转到inspect以定位该类。你知道吗

from bs4 import BeautifulSoup as bs4
import requests

def get_data():

    url = 'https://www.commonsense.org/education/game/garrys-mod'
    r = requests.get(url, headers={"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.103 Safari/537.36"})
    html_bytes = r.text
    soup = bs4(html_bytes, 'lxml')

    res = soup.findAll("div", {"class": "subjects-skills__item"})

    return res

test1 = get_data()

如果你只是想要文本。。你知道吗

# For just the Text
for i in test1:
    print(i.text)

退货

Subjects
Science

Skills
Creativity
Critical Thinking

相关问题更多 >

编程相关推荐

热门问题

热门文章

python bs4 get元素不带selenium

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >