我有一些章节的第一本哈利波特书在txt文件。我想将txt文件拆分为一个包含不同章节的列表,不包含章节号和章节名称。我怎样才能用正则表达式做到这一点
txt如下所示:
Chapter one
The boy who lived
Mr. and Mrs. Dursley, ...
Chapter two
The vanishing glass
Nearly ten years had passed...
因此,我希望我的列表如下所示:
['Mr. and Mrs. Dursley, ...', 'Nearly ten years had passed...']
我不熟悉regex,但以下是我迄今为止尝试过的:
chapter_list = re.split('.*\n\nchapter.*\n\n?, text)
而且所有章节名称都不是以开头的
这应该做到:
您可能会得到一个空元素,但如果需要,可以很容易地删除它
输出:
相关问题 更多 >
编程相关推荐