我有一个油井数据的数据框,它作为一列导入,我的拆分如下:
df = pd.read_csv(r'df.txt', header=None)
df.columns = ['Test']
df = df.Test.str.split(expand=True)
0 1 2 3 4 5 6
0 well 1 20060201 3623.23 0.00 1300.00 None
1 well 1 20060202 3627.07 0.00 1305.00 None
2 well 1 20060203 3576.48 0.00 1305.00 None
... ... .. ... ... ... ... ...
42089 well14 20201114 0.00 0.00 0.00 None
42090 well14 20201115 0.00 0.00 0.00 None
... ... .. ... ... ... ... ...
51000 well 7 20201116 0.00 0.00 0.00 None
51001 well 7 20201117 0.00 0.00 0.00 None
正如您所看到的,我的一些数据包含井名,井号附在井名上。代码将其作为一个实体读取,并将其放入第0列。名称和编号之间有空格的井被排序为第0列和第1列。由于移位,添加了一个额外的列(第6列)
我曾尝试使用str.extract()和str.split()将井号与井号分开,并将其移动到第1列,这样我就可以使用str.cat()将第0列和第1列连接在一起,但我无法让它工作。我需要这个为不同的井名和编号工作
最后,我需要我的数据如下所示:
0 1 2 3 4
0 well 1 20060201 3623.23 0.00 1300.00
1 well 1 20060202 3627.07 0.00 1305.00
2 well 1 20060203 3576.48 0.00 1305.00
... ... .. ... ... ... ...
42089 well 14 20201114 0.00 0.00 0.00
42090 well 14 20201115 0.00 0.00 0.00
... ... .. ... ... ... ...
51000 well 7 20201116 0.00 0.00 0.00
51001 well 7 20201117 0.00 0.00 0.00
非常感谢您的帮助。谢谢大家!
让我们试试:
输出:
相关问题 更多 >
编程相关推荐