XGBoost：在列车和tes中拆分数据

2条回答

网友

1楼 · 编辑于 2024-05-17 14:05:56

我将使用sklearn的train_test_split，它也有一个分层参数，然后将结果放入dtrain和{}。在

from sklearn.cross_validation import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42, stratify=y)

import xgboost as xgb
dtrain = xgb.DMatrix(X_train, label=y_train)
dtest = xgb.DMatrix(X_test, label=y_test)

请参阅此处的实现：A Simple XGBoost Tutorial Using the Iris Dataset。在

网友

2楼 · 编辑于 2024-05-17 14:05:56

您总是可以使用pandas（请参见pandas.HDStore）从HDF5文件中读取数据，然后使用sklearn（简单随机或分层列车/列车拆分，请参见train_test_split的stratify参数）进行拆分。然后您可以直接将pandas数据帧对象馈送到sklearn API of xgboost中，或者将这些对象转换为xgboost.DMatrix，并在本机培训API中使用这些对象

编程相关推荐

java如何处理可以为null或整数的POJO类值
JavaFXSpring类NotFoundException:org。springframework。上下文注释。注释ConfigApplicationContext
java Jackson JSON不包装嵌套对象的属性
编写多个SQL查询的java最佳实践
安卓 java。lang.IllegalStateException:无法提取AndroidPlatform、sslSocketFactory上的信任管理器
MongoDB/Morphia将技术id保存为ObjectId，尽管它在Java中是一个字符串
JavaEclipse只加载log4。测试文件夹中的属性
java如何通过次对角线遍历2D数组？
java在geotools jmappane中制作shapefile编辑器
数组如何在java中获得表大小2^32

相关问题更多 >

编程相关推荐

热门问题

热门文章

XGBoost：在列车和tes中拆分数据

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >