python解析HTML中的特定值

<option class="disabled" value="12_654" > (EU 38 2/3 - US 6) </option> <option class="disabled" value="12_3716" > (EU 39 1/3 - US 6,5) </option> <option class="disabled" value="12_636" > (EU 40 - US 7) </option> <option class="" value="12_634" > EU 40 2/3 - US 7,5 </option> <option class="" value="12_462" > EU 41 1/3 - US 8 </option> <option class="" value="12_460" > EU 42 - US 8,5 </option> <option class="" value="12_459" > EU 42 2/3 - US 9 </option> <option class="" value="12_458" > EU 43 1/3 - US 9,5 </option> <option class="" value="12_457" > EU 44 - US 10 </option> <option class="" value="12_456" > EU 44 2/3 - US 10,5 </option> <option class="" value="12_455" > EU 45 1/3 - US 11 </option> <option class="disabled" value="12_559" > (EU 46 - US 11,5) </option> <option class="disabled" value="12_454" > (EU 46 2/3 - US 12) </option> <option class="disabled" value="12_453" > (EU 47 1/3 - US 12,5) </option> </sel

2条回答

网友

1楼 · 编辑于 2024-04-20 00:38:30

创建一个dict，将每个option的文本映射到它的值，确保从text中删除所有无关的空白：

d = {option.text.strip(): option['value'] for option in soup.find_all('option')}
print(d['(EU 40 - US 7)'])

结果：

12_636

网友

2楼 · 编辑于 2024-04-20 00:38:30

您还可以使用xpath和fromstring

# import requests
from lxml.html import fromstring
# url = ''
# tree = html.fromstring( requests.get(url).content)
h = '''
 <option class="disabled" value="12_654" >
(EU 38 2/3 - US 6)                      </option>
                      <option class="disabled" value="12_3716" >
(EU 39 1/3 - US 6,5)                      </option>
                      <option class="disabled" value="12_636" >
(EU 40 - US 7)                      </option>
                      <option class="" value="12_634" >
EU 40 2/3 - US 7,5                      </option>
                      <option class="" value="12_462" >
EU 41 1/3 - US 8                      </option>
                      <option class="" value="12_460" >
EU 42 - US 8,5                      </option>
                      <option class="" value="12_459" >
EU 42 2/3 - US 9                      </option>
                      <option class="" value="12_458" >
EU 43 1/3 - US 9,5                      </option>
                      <option class="" value="12_457" >
EU 44 - US 10                      </option>
                      <option class="" value="12_456" >
EU 44 2/3 - US 10,5                      </option>
                      <option class="" value="12_455" >
EU 45 1/3 - US 11                      </option>
                      <option class="disabled" value="12_559" >
(EU 46 - US 11,5)                      </option>
                      <option class="disabled" value="12_454" >
(EU 46 2/3 - US 12)                      </option>
                      <option class="disabled" value="12_453" >
(EU 47 1/3 - US 12,5)                      </option>
                    </sel
'''
tree = fromstring(h)
print(tree.xpath("//option[text()[contains(.,'(EU 40 - US 7)')]]/@value"))

相关问题更多 >

编程相关推荐

热门问题

热门文章