我正在尝试从列表中删除特定的单词,以及在文本文件中找到的<title>
和<\title>
。你知道吗
我还需要删除列表中包含的单词words=[a,is,and,there,here]
我的列表lines
由以下文本组成:
lines=
[<title>The query complexity of estimating weighted averages.</title>', '<title>New bounds for the query complexity of an algorithm that learns DFAs with correction and equivalence queries.</title>', '<title>A general procedure to check conjunctive query containment.</title>]
请帮我把清单上的字去掉,还有
首先,你应该总是张贴你已经尝试了。你知道吗
仅使用内置库:
代码解释行:
无需使用正则表达式,您可以更高效地执行此操作:
如果是case matter,则删除
w.lower()
打电话。还有如果您是通过解析网页来提取行,我建议您在写入文件之前从标记中提取文本。你知道吗通过
re.sub
函数。你知道吗单词前后的
\b
有助于精确匹配单词。\b
称为单词边界,匹配单词字符和非单词字符。你知道吗相关问题 更多 >
编程相关推荐