Python：将其他行附加到使用startswith（）创建的列表

网友

1楼 · 编辑于 2024-04-19 19:33:02

试试这个

from collections import defaultdict

d, k = defaultdict(), None

for line in open(r"C:\Temp\test.txt"):
    data = [s for s in line.split(" ") if s != ""]
    if len(data) > 1: k, t = data[0], data[1]
    else: t = data[0]
    d[k] = d.get(k, "") + t 

print d

如果您想将文本放入列表，请将d[k] = d.get(k, "") + t更改为d.setdefault(k, []).append(t)

网友

2楼 · 编辑于 2024-04-19 19:33:02

使用正则表达式：

>>> import re
>>> exp=re.compile(r'^([A-Z]{2})(.+?)(?=(^[A-Z])|\Z)',re.S| re.VERBOSE | re.MULTILINE)
>>> for s in exp.finditer(ifile): print('|',s.group(1),'>',s.group(2))
... 
| AN >    text
     text

| TI >    text

| AU >    text
     text
     text

| CS >    text

| SO >    text


| AN >    text

| TI >    text

| AU >    text
     text

| CS >    text
     text

| SO >    text


>>> print(ifile)
AN   text
     text
TI   text
AU   text
     text
     text
CS   text
SO   text

AN   text
TI   text
AU   text
     text
CS   text
     text
SO   text

所以第（1）组有2个字母的代码，第（2）组后面的文本。在

网友

3楼 · 编辑于 2024-04-19 19:33:02

您可以使用“currentKey”变量来跟踪您看到的当前关键字：

currentKey = ''
sorted_text = []
keywords = set(['AN', 'AU', 'SO'])
for line in file:
    if line.startswith('AN'): 
        currentKey = 'AN'
    elif line.startswith('TI'): 
        currentKey = 'TI'
    elif line.startswith('AU'): 
        currentKey = 'AU'
    elif line.startswith('CS'): 
        currentKey = 'CS'
    elif line.startswith('SO'): 
        currentKey = 'SO'

    if currentKey in keywords:
        line = line.rstrip('\n')
        sorted_text.append(line)

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python：将其他行附加到使用startswith（）创建的列表

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >