用于从给定数据生成新数据行的gplearn库

2024-05-16 19:06:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用gplearn库(genetic programming)从给定的数据集生成新规则。目前,我有11行数据,其中有24列(特性),我将它们作为symbolicCregressor方法的输入,以获取新规则。然而,我得到的只有一条规则。一般来说,如果我给11行数据作为输入,我不应该得到11条新规则吗。如果我做错了,正确的方法是什么?在

import numpy as np
import pandas as pd
from sklearn import preprocessing
from sklearn.model_selection import GridSearchCV
from sklearn.ensemble import ExtraTreesRegressor
from gplearn.genetic import SymbolicRegressor

data = pd.read_csv("D:/Subjects/Thesis/snort_rules/ransomware_dataset.csv")

x_train = data.iloc[:,0:23]
y_train = data.iloc[:,:-1]

gp = SymbolicRegressor(population_size=11,
                           generations=2, stopping_criteria=0.01,
                           p_crossover=0.8, p_subtree_mutation=0.1,
                           p_hoist_mutation=0.05, p_point_mutation=0.05,
                           max_samples=0.9, verbose=1,
                           parsimony_coefficient=0.01, random_state=0)

gp.fit(x_train, y_train)
print(gp._program)

输出为:

X7/(X15*(-X16*X20 - X19 + X2))


Tags: 数据方法fromimportdata规则astrain