从时间序列CSV d构建时间轴

class StateTransition: def __init__(self, variable, from_state, to_state, name, relevant_measurements=()): self.variable = variable self.from_state = from_state self.to_state = to_state self.name = name self.relevant_measurements = relevant_measurements

states = ( StateTransition(variable='State2', from_state=0, to_state=1, name='Cable plugged in', relevant_measurements=('State1', 'Sensor4', )), StateTransition(variable='State2', from_state=1, to_state=0, name='Cable unplugged', relevant_measurements('State1', 'Sensor3', )), )

from datetime import datetime class TimelineEvent: def __init__(self, state_transition: StateTransition, timestamp: datetime): self.st = state_transition self.timestamp = timestamp self.measurements = {}

1条回答

网友

1楼 · 发布于 2024-05-16 16:25:08

虽然这个问题并不十分具体，但人们通常会对来自物联网设备的时间序列数据进行各种处理。你知道吗

重采样、将重采样与实际相结合、应用逻辑（如状态机）和在数据帧之间查找值是常见的。你知道吗

下面是一个例子，一种繁忙的框，显示了上面关于时间序列数据的一些内容，由datetimeindex操作。你知道吗

import pandas as pd
import random as r
from pandas.compat import StringIO
print(pd.__version__)

daterange = pd.date_range('2019-01-01 11:00', '2019-01-01 13:00', periods = r.randint(10,30))
df = pd.DataFrame(index=daterange, data={'sensor_data': [r.randint(0,5) for i in range(len(daterange))]})

# the actual datapoints
actual_datapoints = df.copy()
actual_datapoints['actual'] = True

# resample e.g. visualization purposes
df = df.resample('5T').last().ffill()
# but let's not confuse these datapoints and the result of resampling with actual datapoints
df['actual'] = False
# for these false datapoints, delete the ones for which there is an actual
mask = df.index.isin(actual_datapoints.index)
df = df.drop(df[mask].index)

# combine actual datapoints with the resampled timeseries
df = pd.concat([actual_datapoints, df])
df.sort_index(inplace=True)

# a lookup dataframe, lookups by datetimeindex
data = """datetime,lookup_val
2019-01-01 11:00,100
2019-01-01 11:30,200
2019-01-01 12:00,300
"""
lookup_df = pd.read_csv(StringIO(data), index_col='datetime', parse_dates=True, infer_datetime_format=True)

# a really bad state machine. :-)
state=None
def statefunc(x):
    global state
    if x != state:
        state = x
        return 'edge'
    return state

df['state'] = df['sensor_data'].apply(statefunc)

# actual, resampled, and looked up values 
df = df.join(lookup_df)
print(df)

下面提到的是基于近似时间戳的查找。见：https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.merge_asof.html

相关问题更多 >

编程相关推荐

热门问题

热门文章