scikit-learn LDA函数中的错误 - 绘图显示非零相关性

7 投票

2 回答

664 浏览

提问于 2025-04-18 15:05

我用scikit-learn的LDA功能做了一些线性判别分析，结果发现我的图表中，LD（线性判别）之间有非零的相关性。

from sklearn.lda import LDA
sklearn_lda = LDA(n_components=2)
transf_lda = sklearn_lda.fit_transform(X, y)

这让我很担心，所以我回去用鸢尾花数据集作为参考。我还在scikit的文档中找到了同样的非零相关性LDA图，我也能复现出来。

总之，给你一个大概的样子：

这里输入图片描述

我把代码放在了一个IPython笔记本里，如果你想看看并自己试试，可以去看看。

数据可视化机器学习统计分析 scikit-learn 鸢尾花数据集相关性 lda 线性判别分析

2 个回答

好的，现在我们来看看发生了什么事情（根据GitHub上的讨论）。在scikit-learn中的LDA（线性判别分析）没有一个正交归一的基底。

我想把这个作为答案发布，这样我就可以关闭这个问题了。感谢大家的讨论！

这里输入图片描述

from sklearn.decomposition import PCA
sklearn_pca = PCA(n_components=2)
transf_pca = sklearn_pca.fit_transform(transf_lda)

这里输入图片描述

为了比较，这里再次展示逐步的方法。

这里输入图片描述

回答于 2025-04-18 由 Python大师

分享举报

确实在LDA的转换功能里有个错误：分类器的权重在实际转换之后错误地被应用了。这个问题已经在这里修复了。修改已经合并到主分支，所以在scikit-learn的1.6版本中应该能看到这个修复。

回答于 2025-04-18 由 Python大师

分享举报