从两个不匹配的时间序列构造数据帧

2024-04-20 06:12:48 发布

您现在位置:Python中文网/ 问答频道 /正文

The raw csv dataThe reference data我想从两个单独的DateTimeIndexed数据帧(raw和ref)中匹配两个不匹配的时间序列,并将它们组合成一个完整的数据帧,以完整的时间序列作为索引(因此一些nan将作为df值出现)

如何创建一个具有完整DateTimeIndex(无缺失值)的数据帧,以“容纳”这两个时间序列,每个时间序列都缺少一些值? enter image description here

下面是我尝试的:提取两个df的列(这里是raw2和ref2),对它们进行索引,并将它们放在一个新的数据帧中。这是正确的方法吗?如果是的话(我怀疑是的),为什么我的最终结果会有这么多“南”?我做错了什么?你知道吗

raw2 = raw2.reset_index().drop_duplicates(subset='index', keep='last').set_index('index')
    ref2 = ref2.reset_index().drop_duplicates(subset='index', keep='last').set_index('index')

rawdates = pd.to_datetime(raw2.index)
refdates = pd.to_datetime(ref2.index)


WE_COA4_S1 = raw2['AS_box2_COA4_132800061_WE']
AE_COA4_S1 = raw2['AS_box2_COA4_132800061_AE']
WE_COA4_S1.index = rawdates
AE_COA4_S1.index = rawdates

TEMP = ref2['UCAM_TEMP (degrees)']
TEMP.index = refdates

rng = pd.date_range('17/12/2015', freq='min', periods=1440*64, format = '%y-%d-%m')
   d = {'WorkingElectrode_COA4S1':WE_COA4_S1, 'AuxiliaryElectrode_COA4S1':AE_COA4_S1,
     'Temperature':TEMP}
df = pd.DataFrame(data=d, index = rng)

这个df中有太多的nan。为什么它不接受序列中的值?你知道吗


Tags: 数据dfindex时间序列nantemppd