美丽的精灵和Python

<div class="synonym-description"> <em class="txt">noun</em> <strong class="ttl">animate being; mammal</strong> </div> <div class="relevancy-block"> <div class="relevancy-list">

<li><a href="http://www.thesaurus.com/browse/pet" class="common-word" data-id="1" data-category="{"name": "relevant-3", "color": "#fcbb45"}" data-complexity="1" data-length="1"><span class="text">pet</span><span class="star inactive">star</span></a></li>

3条回答

网友

1楼 · 编辑于 2024-05-13 07:09:26

可以使用find_all函数，其中第一个参数是类型（'div'，'a'等），第二个参数可以按类过滤。你知道吗

soup.find_all('em', {'class':"txt"})

这样你就可以用类“txt”得到所有的“em”。你知道吗

soup.find_all('div', {'class':"relevancy-block"})

在这里，您将找到所有类名为“relevancy block”的“div”

网友

2楼 · 编辑于 2024-05-13 07:09:26

import requests, bs4
url = "http://www.thesaurus.com/browse/animal?s=t"
r = requests.get(url)
soup = bs4.BeautifulSoup(r.text, 'lxml')
for txt in soup.find_all(class_="txt"):
    relevancy_list = txt.find_next(class_="relevancy-list")

网友

3楼 · 编辑于 2024-05-13 07:09:26

多亏了我收到的两条评论，我找到了这样做的方法：

下面的代码首先查看过滤器，然后如果过滤器是一个名词或动词，如果它是一个名词，它会列出所有分类为常用词的名词

def _get_soup_object(url):
    return BeautifulSoup(requests.get(url).text)

term="animal" 

data = _get_soup_object("http://www.thesaurus.com/browse/{0}".format(term))

for selector_var in data.find_all(class_="filters"):

    word_type=selector_var.find_all(class_="txt")
    if word_type[0].text=="adj":
        print("This is an adjective, which we don't want")

    elif word_type[0].text=="noun":
        print("This is a noun, which we do want")

        word_list=selector_var.find_all(class_="common-word")
        for indv_word in word_list:
            print(indv_word.text[:-4])

相关问题更多 >

编程相关推荐

热门问题

热门文章