web抓取中类多输入的处理

## cdkitchen.com url= 'http://www.cdkitchen.com/recipes/recs/32/Snowball_Cookies_II54545.shtml' r = requests.get(url) page_body = r.text soup=BeautifulSoup(page_body, 'html.parser') stat= soup.find('div', class_='col-md-4 col-sm-4 mb-20') for a in stat.find('form', class_='change-servs-form'): print(a.get_value())

2条回答

网友

1楼 · 编辑于 2024-05-16 06:10:49

这就是在beautifulsoupfind方法
{'class': 'classname'}中正确指定类的方式

另外，使用soup.get('attribute')从给定的标记中获取任何属性（value）

工作代码：

stat = soup.find('div', {'class': 'col-md-4 col-sm-4 mb-20'})
for a in stat.find('form', {'class': 'change-servs-form'}):
    print(a.get('value'))

36

注意：我更喜欢CSS选择器，但我不想对你的代码有太多的磨练。你应该调查一下：）

编辑

使用CSS选择器，从form内的每个input标记获取valueattr

stat = soup.find('form', {'class': 'change-servs-form'})
input_tags = stat.select('input')
for a in input_tags:
    print(a.get('value'))

36
21411
change servings
reset

网友

2楼 · 编辑于 2024-05-16 06:10:49

另一种方式可以是下面的方式。使用css选择器：

import requests
from bs4 import BeautifulSoup

res = requests.get('http://www.cdkitchen.com/recipes/recs/32/Snowball_Cookies_II54545.shtml')
soup = BeautifulSoup(res.text, 'lxml')
item_name = '\n'.join([item['value'] for item in soup.select('.change-servs-form input')])
print(item_name)

输出：

36
21411
change servings
reset

相关问题更多 >

编程相关推荐

热门问题

热门文章