我有一个.csv读入一个数据帧,列的名称在previos行的同一个.csv文件中。通常我删除所有“不必要的”行来创建数据帧,然后硬编码每个数据帧的名称
Trigger time,2017-07-31,10:45:38
CH,Signal name,Input,Range,Filter,Span
CH1, "Tin_MIX_Air",TEMP,PT,Off,2000.000000,-200.000000,degC
CH2, "Tout_Fan2b",TEMP,PT,Off,2000.000000,-200.000000,degC
CH3, "Tout_Fan2a",TEMP,PT,Off,2000.000000,-200.000000,degC
CH4, "Tout_Fan1a",TEMP,PT,Off,2000.000000,-200.000000,degC
在这里,您可以看到列名称用双引号“TinMix”、“Tout..”等表示的行,正好有16行带有名称
Logic/Pulse,Off
Data
Number,Date&Time,ms,CH1,CH2,CH3,CH4,CH5,CH7,CH8,CH9,CH10,CH11,CH12,CH13,CH14,CH15,CH16,CH20,Alarm1-10,Alarm11-20,AlarmOut
NO.,Time,ms,degC,degC,degC,degC,degC,degC,%RH,%RH,degC,degC,degC,degC,degC,Pa,Pa,A,A1234567890,A1234567890,A1234
1,2017-07-31 10:45:38,000,+25.6,+26.2,+26.1,+26.0,+26.3,+25.7,+43.70,+37.22,+25.6,+25.3,+25.1,+25.3,+25.3,+0.25,+0.15,+0.00,LLLLLLLLLL,LLLLLLLLLL,LLLL
每个变量的值从这里开始。你知道吗
我需要做的是从这个.csv文件中创建一个数据帧,并将这些名称放在列名称中。我是Python的新手,不太清楚该怎么做
import pandas as pd
path = r'path-to-file.csv'
data=pd.DataFrame()
with open(path, 'r') as f:
for line in f:
data = pd.concat([data, pd.DataFrame([tuple(line.strip().split(','))])], ignore_index=True)
data.drop(data.index[range(0,29)],inplace=True)
x=len(data.iloc[0])
data.drop(data.columns[[0,1,2,x-1,x-2,x-3]],axis=1,inplace=True)
data.reset_index(drop=True,inplace=True)
data = data.T.reset_index(drop=True).T
data = data.apply(pd.to_numeric)
这就是我到目前为止所做的,用有用的数据来获取我的数据帧,我删除了所有其他对我不有用的列,只保留值。最后三行是重置行/列索引,并将整个df转换为float。我想用我在第一段代码中显示的每个名称来命名列,就像我在手动执行此操作之前所说的那样:
data.columns = ['a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p']
但我想从.csv文件中获取它们,因为有可能更改CH#-“Name”组合
非常感谢你的帮助!你知道吗
假定列名从第2行到第6行,数据从第7行到EOF。
例如(未测试代码)
从以下内容开始:
相关问题 更多 >
编程相关推荐