所有人。你知道吗
下面是我用来解析文本文件的代码:
import pandas as pd
tags = ['129','30','32','851','9730','9882']
rows = []
file = open('D:\\python\\redi_fix\\redi_august.txt','r')
content = file.readlines()
for line in content:
for message in line.split('\t'):
try:
row_dict = {}
tag,val = message.split('=')
if tag in tags:
row_dict[tag]=val
rows.append(row_dict)
except:
pass
从行创建数据帧会产生以下结果:
129 30 32 851 9730 9882
r170557 NaN NaN NaN NaN NaN
NaN ARCA NaN NaN NaN NaN
NaN NaN 100 NaN NaN NaN
r170557 NaN NaN NaN NaN NaN
NaN ARCA NaN NaN NaN NaN
NaN NaN 300 NaN NaN NaN
看起来键的每个值都在不同的行上。 我努力实现的结果是所有值都在同一行上—例如,请参见下面的示例:
129 30 32 851 9730 9882
r170557 ARCA 100 NaN NaN NaN
r170557 ARCA 300 NaN NaN NaN
如果您想“折叠”您的
NaN
,您可以在first
/last
上执行groupby
+agg
:使用结果数据帧,我们需要
sorted
和dropna
相关问题 更多 >
编程相关推荐