我试图读取一个.txt文件作为熊猫数据帧,但我得到了几个错误,数据没有加载。我发现的问题与数据的结构有关。你知道吗
file.txt:
"Mark","Company","Country","Value","1","abcdef","ecu","1000","","","usa","30","","","col","200"....
那个文件.txt显示如下信息:
Mark Company Country Value ...
1 abcdef ecu 1000 ...
usa 30 ...
col 200 ...
2 ghijk jap 10 ...
eur 900 ...
lki ...
3 lmnop wer 21 ...
uye ...
urg 123 ...
. . . . .
. . . . .
我需要的是一个数据帧,其结构类似于:
Mark Company Country Value ...
1 abcdef ecu 1000 ...
1 abcdef usa 30 ...
1 abcdef col 200 ...
2 ghijk jap 10 ...
2 ghijk eur 900 ...
2 ghijk lki 0 ...
3 lmnop wer 21 ...
3 lmnop uye 0 ...
3 lmnop urg 123 ...
. . . . .
. . . . .
更新:
旧答案:
您的文件看起来像一个固定宽度的文件,所以请尝试将pd.read_fwf与DataFrame.ffill()结合使用
假设我们有以下TXT文件:
解决方案:
相关问题 更多 >
编程相关推荐