混淆矩阵精度评估非等长用户和生产者数据集

2024-04-16 16:12:46 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试执行以下分类评估:enter image description here

我的问题是,我的分类有超过3000000分类像素和我的训练数据集只有约30-40(10-15为每一类可以说明)。你知道吗

我的两个数据集的布局如下所示:

Training row example = [[230,40,120,2]] With the first three values being the pixel color bands (BGR) and the final being the stated output class (Can we 1-3).

我正在以csv文件的形式读入训练数据,并将其转换为数据帧。你知道吗

问题:即使我在两个数据集中有不同数量的预测和实际数据值,是否可以使用这种方法?如果是这样的话,我不确定第9行到第13行是用来做什么的。你知道吗

代码:

b,g,r = cv2.split(img)
# Pandas dataset
dataSet = pd.DataFrame({'bBnad':b.flat[:],'gBnad':g.flat[:],'rBnad':r.flat[:]})
dataSet['class'] = X_clustered
training = pd.read_csv("/Users/chrisradford/Documents/School/Masters/RA/Classifier/Python/Training.csv")

Tags: csvthe数据examplewithtraining分类像素