基本上,我正在尝试从一个HTML文件列表中删除所有HTML标记。 当我尝试这样做时,我得到了一个错误:
TypeError: expected string or bytes-like object.
那么有没有一种方法可以用regex遍历一个列表呢?你知道吗
以下是我使用的代码:
import pymssql
import re
conn = pymssql.connect(
host='xxx',
port=xxx,
user='xxx',
password='xxx',
database='xxxx'
)
cursor = conn.cursor()
cursor.execute('SELECT 'column' FROM 'table'')
text = cursor.fetchall()
conn.close()
raw = []
raw.append(text)
str(raw)
x = re.sub('<[^<]+?>', '', raw)
查看BeautifulSoup包。它是一个HTML解析器,您可以像对待普通python字典一样对待它。你知道吗
错误:
指
raw
指向list
对象的事实,将其指向字符串。你需要做:但是,如果
text
确实是一个字符串,为什么不只是:有关更多详细信息,请参阅str上的文档,下面的引用来自于此:
相关问题 更多 >
编程相关推荐