我的代码:
# Create Decision Tree classifer object
clf = DecisionTreeClassifier()
# Train Decision Tree Classifer
clf = clf.fit(X_train,y_train)
# Using random forest to make sure my model doesn't overfit
from sklearn.ensemble import RandomForestClassifier
clf = RandomForestClassifier(n_estimators = 20) #n_esitmators value can be changed according to need
clf = clf.fit(ft,pima['brand'])
我想知道代码中关于上述随机森林分类器应用的最佳解释。这次使用这个随机森林分类器的原因是什么
哎呀!你的问题到底是关于什么的?这里的结局是什么?基本上,随机森林算法是决策树的集合。单个决策树对数据变化非常敏感。它很容易过度拟合数据中的噪声。只有一棵树的随机林也会过度拟合数据,因为它与单个决策树相同
当我们将树木添加到随机森林中时,过度拟合的趋势应该会减少(多亏了装袋和随机特征选择)。但是,泛化误差不会变为零。随着添加更多的树,泛化误差的方差将接近零,但偏差不会
运行以下示例:
相关问题 更多 >
编程相关推荐