我目前正在为我的kNN分类算法实现ROC曲线。我知道ROC曲线是真阳性率与假阳性率的曲线图,我正努力从数据集中找到这些值。我进口'自身免疫.csv'并在其上运行kNN算法以输出精度值。化学试剂盒-学习网文件显示,要生成TPR和FPR,我需要通过y_test和y_分数的值,如下所示:
fpr, tpr, threshold = roc_curve(y_test, y_scores)
我只是在挣扎我应该用什么作为这些价值观。
感谢您的帮助,如果有什么我错过了道歉,因为这是我在这里的第一个帖子。在
^{pr2}$
Tags:
如果您查看documentation for ^{} ,您将看到关于
y_score
参数的以下内容:您可以使用sklearn中的^{} method of the ^{} 获得概率估计。这将返回一个numpy数组,其中两列用于二进制分类,负类和正类各一列。对于
roc_curve()
函数,您要使用正类的概率估计值,因此可以替换:有:
^{pr2}$请注意,您需要如何使用
[:, 1]
获取第二列的所有行,以便只选择正类的概率估计值。这里有一个使用威斯康星州乳腺癌数据集的最小可重复性示例,因为我没有您的autoimmune.csv
:这将生成以下ROC曲线:
相关问题 更多 >
编程相关推荐