从python中的txt文件读取表

""" Ò NDG ANAGRAFICA RAPPORTO S.CONTABILE FIDO BASE STR. FIDO PROP. F./SC. INIZ. GG. Ò STATUS POSIZIONE Ò Ò Ò 335647423 ERNESTORI MATTIO 03/045/23467890* 5,67 0,00 0,00 13,20 1/73 02/03/21 3 Ò +RIENTRO SCAD/SCO Ò Ò 567890432 PIAL MASSIMILI 23/345/12345678* 131,42- 0,00 0,00 124,34 1/34 06/03/21 1 """

1条回答

网友

1楼 · 发布于 2024-05-13 23:11:46

这是一个有趣的问题。似乎有两个观察结果需要处理：1）行由空行分隔；2）列可以向左或向右对齐，但在行中设置索引。使用这两个确定性，可以使用以下设置：1）按索引拆分行；2）根据是否由空列表（行）分隔，对列表列表中的行进行分组；3）为相同索引在组中加入字符串：

import pandas as pd
from itertools import groupby

data = """
Ò         NDG  ANAGRAFICA             RAPPORTO        S.CONTABILE       FIDO BASE           STR.       FIDO PROP. F./SC.  INIZ.   GG.
Ò              STATUS               POSIZIONE
Ò           
Ò           
Ò   335647423  ERNESTORI MATTIO 03/045/23467890*             5,67            0,00           0,00            13,20  1/73 02/03/21    3
Ò             +RIENTRO SCAD/SCO
Ò           
Ò   567890432  PIAL MASSIMILI   23/345/12345678*           131,42-           0,00           0,00           124,34  1/34 06/03/21    1
"""

#list of indices to split lines on
indices = [1,13,32,48,66,81,96,113,120,128,133]
#split lines by indices, generates a list of lists
text = [[s[i:j].strip() for i,j in zip(indices, indices[1:]+[None])] for s in data.splitlines()]
#group items in the list together 
text = [list(g) for k, g in groupby(text, key=lambda x: all('' == s for s in x)) if k == False]
#join elements in groups and strip trailing whitespaces
text = [[item.strip() for item in l] for l in [list(map(" ".join, zip(*i))) for i in text]]
df = pd.DataFrame(text[1:], columns=text[0])

结果:

^{tb1}$

相关问题更多 >

编程相关推荐

热门问题

热门文章

从python中的txt文件读取表

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >