我正在使用Beautiful Soup来查找具有特定unicode glyph(http://en.wikipedia.org/wiki/Miscellaneous_Symbols)的元素。我有一个HTTML元素,看起来像:
<li>★ mytext</li>
我试过:
# pattern = re.compile(r'★)
pattern = re.compile(u'★')
# pattern = re.compile('U+2605')
soup.find_all('li', text=pattern)
但每次我都会得到一张空名单。我做错什么了?你知道吗
您需要提供Unicode代码点:
参见Python string literal documentation。你知道吗
演示:
相关问题 更多 >
编程相关推荐