使用点列表列训练模型

2024-05-16 18:27:11 发布

您现在位置:Python中文网/ 问答频道 /正文

我想根据裂缝的深度对其进行分类。 为此,我将以下功能存储在数据框中:

WindowsDf = pd.DataFrame(dataForWindowsDf, columns=['IsCrack', 'CheckTypeEncode', 'DepthCrack',
                                                    'WindowOfInterest'])
#dataForWindowsDf is a list which iteratively built from csv files.
#Windows data frame taking this list and build a data frame from it.

因此,我的目标列是“DepthCrack”,其他列是特征向量的一部分。 WindowOfInterest是一列2d列表-点列表-表示已完成测试的图形(基于从表面返回的电磁波作为时间的函数):

[[0.9561600000000001, 0.10913097635410397], [0.95621,0.1100000]...]

我面临的问题是如何训练一个模型——使用一列2d列表(我试图按原样推,但没有成功)? 你建议用什么方法来处理这个问题

我考虑从2d列表中提取特征,以获得一维特征(积分等)


Tags: 数据from功能列表data分类特征frame
1条回答
网友
1楼 · 发布于 2024-05-16 18:27:11

您可以将这一特性一分为二,就像WindowOfInterest可以变成:

WindowOfInterest_x1WindowOfInterest_x2

例如,您的DataFrame

>>> import pandas as pd

>>> df = pd.DataFrame({'IsCrack': [1, 1, 1, 1, 1], 
...                    'CheckTypeEncode': [0, 1, 0, 0, 0], 
...                    'DepthCrack': [0.4, 0.2, 1.4, 0.7, 0.1], 
...                    'WindowOfInterest': [[0.9561600000000001, 0.10913097635410397], [0.95621,0.1100000], [0.459561, 0.635410397], [0.4495621,0.32], [0.621,0.2432]]}, 
...                   index = [0, 1, 2, 3, 4])
>>> df
    IsCrack CheckTypeEncode DepthCrack  WindowOfInterest
0   1       0               0.4         [0.9561600000000001, 0.10913097635410397]
1   1       1               0.2         [0.95621, 0.11]
2   1       0               1.4         [0.459561, 0.635410397]
3   1       0               0.7         [0.4495621, 0.32]
4   1       0               0.1         [0.621, 0.2432]

我们可以{}像这样{}

>>> df[['WindowOfInterest_x1','WindowOfInterest_x2']] = pd.DataFrame(df['WindowOfInterest'].tolist(), index=df.index)
>>> df

        IsCrack  CheckTypeEncode    DepthCrack          WindowOfInterest                           WindowOfInterest_x1  WindowOfInterest_x2
0       1        0                  0.4                 [0.9561600000000001, 0.10913097635410397]  0.956160             0.109131
1       1        1                  0.2                 [0.95621, 0.11]                            0.956210             0.110000
2       1        0                  1.4                 [0.459561, 0.635410397]                    0.459561             0.635410
3       1        0                  0.7                 [0.4495621, 0.32]                          0.449562             0.320000
4       1        0                  0.1                 [0.621, 0.2432]                            0.621000             0.243200

最后,我们可以dropWindowOfInterest

>>> df = df.drop(['WindowOfInterest'], axis=1)
>>> df
    IsCrack CheckTypeEncode DepthCrack  WindowOfInterest_x1 WindowOfInterest_x2
0   1       0               0.4         0.956160            0.109131
1   1       1               0.2         0.956210            0.110000
2   1       0               1.4         0.459561            0.635410
3   1       0               0.7         0.449562            0.320000
4   1       0               0.1         0.621000            0.243200

现在,您可以将WindowOfInterest_x1WindowOfInterest_x2作为模型的功能传递

相关问题 更多 >