用python和selenium抓取网站的父子条件语句

2024-05-15 15:01:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图从一个使用python3和selenium chromedriver的网站上搜集产品评论

这些评论中包含了公司的回应(删除这些)。这些公司回复很容易识别,因为内容的标题总是“来自x公司的回复”

我想要一个python3函数:

if 'response from company x' not in mydriver.find_element_by_class_name('bv_content_title').text:
    search for child classes of ('bv_content_core')
    append child class ('bv_content_review_text') to list

我在使用与HTML中的“类”相关的父子关系时遇到问题。我应该给父类命名('bv\u content\u core'),然后搜索core的所有子类以匹配字符串吗?有没有更简单的方法来使用XPath父级/子级


Tags: textcorechild标题内容产品网站selenium
1条回答
网友
1楼 · 发布于 2024-05-15 15:01:59

不知道你是什么后,我猜名单

if 'response from company x' not in mydriver.find_element_by_class_name('bv_content_title').text:
    mylist=mydriver.find_elements_by_css_selector('.bv_content_core .bv_content_review_text')
    print(mylist)

或者试试第二个

if 'response from company x' not in mydriver.find_element_by_class_name('bv_content_title').text:
    parent=mydriver.find_element_by_css_selector('.bv_content_core')
    mylist=[]
    for child in parent.find_elements_by_css_selector('.bv_content_review_text'):
         mylist.append(child.text)

相关问题 更多 >