一种方便快捷的序列数据特征工程工具
seq2ftr的Python项目详细描述
此项目处理系列数据
支持系列数据特征计算。
安装
您需要在系统上安装python才能使用seq2ftr。
这个包包含许多特征提取方法。
支持不同类型(连续/类)的特征计算。
>>> $ pip install seq2ftr
- 安装要求
- 努比
- 熊猫
- sklearn
特征计算
Support Function
- mean
- max
- min
- freq_of_max
- freq_of_min
- median
- median_mean_distance
- percentage_below_mean
- var
- std
- uniqueCount
- …
支撑类型
- 0 - boolean
- 1 - numericla
- 2 - categorical
示例
首先,我们将数据加载到python
>>> import pandas as pd df = pd.DataFrame([[1,200,"1"],[1,500,"2"],[2,300,"2"],[2,600,"2"]],columns=['id','stock_price',"type"]) df = df.set_index("id")
>>> from seq2ftr import SequenceTransformer st_num = SequenceTransformer() st_num.transformer(df['stock_price']) # output all features