在Python中使用REGEX匹配行之间的元素

<td class="size-price last first" colspan="4"> 12.5 kilograms $619.06 $523.91 </td>

1条回答

网友

1楼 · 发布于 2024-04-26 20:37:20

Avoid用regex解析HTML。使用这个工具，一个HTML解析器，比如BeautifulSoup——它功能强大，易于使用，可以完美地处理您的案例：

from bs4 import BeautifulSoup


data = """
<td class="size-price last first" colspan="4">
                    <span>12.5 kilograms </span>
            <span> <span class="strike">$619.06</span> <span class="price">$523.91</span>
                    </span>
                </td>"""
soup = BeautifulSoup(data)

print soup.td.span.text

印刷品：

12.5 kilograms

或者，如果td是更大结构的一部分，则按类查找它并从中获取第一个span的文本：

print soup.find('td', {'class': 'size-price'}).span.text

UPD（处理多个结果）：

print [td.span.text for td in soup.find_all('td', {'class': 'size-price'})]

希望有帮助。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

在Python中使用REGEX匹配行之间的元素

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >