询问:为什么我的正则表达式代码不能读取所有字符?

2024-05-15 08:46:53 发布

您现在位置:Python中文网/ 问答频道 /正文

我有以下描述我想报废使用我的程序。你知道吗

<hr>为非洲过渡委员会学员提供多达13种实践领导力和专业培训的选择 通过接触美国空军的职能、部署和就业行动。外语和文化的沉浸也可以/可能,但总体重点仍然是领导力发展和实践。所有在美国和国外选定的空军基地和其他地点进行的非现场项目。<br>

我有以下代码:

findDescription = re.findall('<hr>(.*?)(?:<strong>|<br>)', coursePage)

我得到以下输出:

['通过接触美国空军的职能、部署和训练,为非洲过渡委员会学员提供多达13种实际领导和专门训练的选择,和就业操作。\xc2\xa0外语和文化沉浸也可用/可能,但总体重点仍然是领导力培养和实践。\xc2\xa0在美国和国外选定的空军基地和其他地点进行的所有非现场项目。']

为什么我会在这里得到像\xc2\xa0这样奇怪的东西?我的代码也会被引号符号"绊倒。坦白地说,我认为regex代码中的句点.应该接受所有字符串。出什么问题了?你知道吗

我很感激你的提示。我只是在周五才听说regex,我已经取得了巨大的进步,但这次真的让我绊倒了几个小时。你知道吗

致以热烈的问候, GeekyOmega公司


Tags: 代码重点部署hr文化xa0职能委员会