有没有一种方法可以用正则表达式在列表中循环?

2024-04-20 01:45:34 发布

您现在位置:Python中文网/ 问答频道 /正文

基本上,我正在尝试从一个HTML文件列表中删除所有HTML标记。 当我尝试这样做时,我得到了一个错误:

TypeError: expected string or bytes-like object.

那么有没有一种方法可以用regex遍历一个列表呢?你知道吗

以下是我使用的代码:

import pymssql
import re

conn = pymssql.connect(
    host='xxx',
    port=xxx,
    user='xxx',
    password='xxx',
    database='xxxx'
)
cursor = conn.cursor() 
cursor.execute('SELECT 'column' FROM 'table'')

text = cursor.fetchall()

conn.close()

raw = []  
raw.append(text)

str(raw)

x = re.sub('<[^<]+?>', '', raw)

Tags: 文件text标记importre列表rawhtml
2条回答

查看BeautifulSoup包。它是一个HTML解析器,您可以像对待普通python字典一样对待它。你知道吗

错误:

TypeError: expected string or bytes-like object.

raw指向list对象的事实,将其指向字符串。你需要做:

raw = str(raw)  # instead of just str(raw)

但是,如果text确实是一个字符串,为什么不只是:

x = re.sub('<[^<]+?>', '', text)

有关更多详细信息,请参阅str上的文档,下面的引用来自于此:

Return a str version of object. See str() for details.

相关问题 更多 >