使用pandas打开文本文件,其中某些行的形式不同

2024-04-18 11:28:44 发布

您现在位置:Python中文网/ 问答频道 /正文

嗨,我开始学习处理文本文件。到目前为止,我一直在使用numpy loadtxt,但我对一个非常旧的程序生成的一些文本文件有一些问题(我无法替换):

[/home/Desktop/Flux_Calibration_Steps/stdWolf_wide_cr_f_a_bg] 1 4091 300.01 1.195  4240.778  7791.743 wolf wide
 4330.00   1.3731E-13   20.000       88809.
 4350.00   1.3480E-13   20.000      117447.
 4370.00   1.5911E-13   20.000      162742.
 4390.00   1.6972E-13   20.000      183740.
 4510.00   1.8634E-13   20.000      863055.
 4530.00   1.8641E-13   20.000     1056961.
 4550.00   1.8308E-13   20.000     1215476.
 4570.00   1.7654E-13   20.000     1352265.
[/home/Desktop/Flux_Calibration_Steps/stdF34_wide_cr_f_a_bg_] 1 4091 300.01 1.037  4241.941  7793.365 F34 broad
 4400.00   2.8298E-13   50.000     1244259.
 4450.00   2.6912E-13   50.000     1978971.
 4500.00   2.5837E-13   50.000     3862673.
 4550.00   2.4811E-13   50.000     5843749.
 4600.00   2.3832E-13   50.000     7363710.

这里的数据是4列表的形式。如您所见,有两个较长的行。它们表示来自不同来源的数据,代码一个接一个地堆叠这些数据。你知道吗

我想从第一列和第二列的不同来源中提取数据。如果可能的话,我还想从标题行获取数据。你知道吗

然而,我不知道这是“Python”的方式做到这一点。我想知道是否有人会提供一些建议,如何在不进行循环的情况下识别每个“header”行的索引。你知道吗

一些警告:

1)列数是恒定的,在标题行和数据行中都是如此。但元素可能不同 2) 多个数据源的行数可能不同

谢谢你的建议。你知道吗


Tags: 数据numpy标题home来源steps建议cr