我是python新手,我尝试使用python从段落中提取文本。 文本为:
<stx>(FPL-ACF66-IN
-EH30/H-S/C
-LGKR0900
-N0100VFR KRK ARA
-LGTG0300
-DOF/120928)
<etx>
<stx>GG
(APL-ACF66-IN
-EH30/H-S/C
-LGKR0900
-N0100VFR KRK ARA
-LGTG0300
-DOF/110928)
<etx>
<stx>
(CNL-ACF66-IN
-EH30/H-S/C
-LGKR0900
-N0100VFR KRK ARA
-LGTG0300
-DOF/120928)<etx>
我想从FPL中提取整页
(FPL-ACF66-IN
-EH30/H-S/C
-LGKR0900
-N0100VFR KRK ARA
-LGTG0300
-DOF/120928)
我使用该代码,但它只提取第一行:FPL-ACF66-IN
import re
with open('FPL.txt', 'r', encoding = 'utf-8') as f:
works = f.read()
pattern = 'FPL'+'.*'
w =re.findall(pattern, works, re.I)
for work in w:
print(work)
什么是我的错
当然可以使用(see a demo here这样的正则表达式,但要注意修饰符)
在我看来,这就像某种
xml
文件,所以为什么不改用解析器呢?Python
中的代码段:这就产生了
如果您想在这里有所有段落,您可以使用
甚至
然后在它们上面循环,参见the modified demo和this one for ^{} and ^{} 。
对于后者:
相关问题 更多 >
编程相关推荐