如何将包含多个表的.dat文件读入一个数据帧？

mylines = [] with open ('raw_file.dat', 'rt') as myfile: for myline in myfile: mylines.append(myline) string = (mylines[8:]) with open("updated.dat", "w") as output: output.write(str(string))

1条回答

网友

1楼 · 发布于 2024-04-27 14:46:39

如果您可以确定所需的第三个表从第8行开始，那么就没有理由让它比从第8行开始索引文件更复杂了。在这里，您可以使用字符串操作和列表理解来清理数据：

import pandas as pd

# Read the data.
with open('raw_data.dat', 'r') as fh:
    lines = fh.readlines()[8:]

# Remove newlines, tabs, and split each string separated by spaces.
clean = [line.strip.replace('\t', '').split() for line in lines]

# Feed the data into a DataFrame.
data = pd.DataFrame(clean[1:], columns=clean[0])

输出：

               Time         Variab1e1  ...               v18               v19
0  +0.00000000e+000  +3.04142181e-002  ...  +0.00000000e+000  +0.00000000e+000
1  +1.00000000e+000  +1.96144191e-001  ...  +1.00000000e+000  +0.00000000e+000
2  +2.00000000e+000  +3.75599731e-001  ...  +2.00000000e+000  +0.00000000e+000

如果要将值转换为浮点值，可以在将数据转换为数据帧之前执行此操作：

headers = clean[0]
rows = [[float(value) for value in row] for row in clean[1:]]

data = pd.DataFrame(rows, columns=headers)

让你的身体更干净：

   Time  Variab1e1  Variable2  Variable3  Variable4  ...  v15  v16   v17  v18  v19
0   0.0   0.030414        0.0   1.383808        0.0  ...  0.0  0.0  15.0  0.0  0.0
1   1.0   0.196144        1.0   7.660262        1.0  ...  0.0  1.0  15.0  1.0  0.0
2   2.0   0.375600        2.0  15.356726        2.0  ...  0.0  2.0  15.0  2.0  0.0

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何将包含多个表的.dat文件读入一个数据帧？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >