擅长:python、mysql、java
<p>我不同意其他人的看法。</p>
<p>虽然可以对二进制数据(例如,一个热编码数据)使用PCA,但这并不意味着PCA是一件好事,否则它会很好地工作。</p>
<p>PCA被设计为<em>连续</em>变量。它试图最小化方差(=平方偏差)。当你有二进制变量的时候,平方偏差的概念就崩溃了。</p>
<p>所以是的,你可以用PCA。是的,你得到一个输出。它甚至是一个最小平方输出-这并不像主成分分析会对这样的数据进行分段。它是有效的,但是它的意义比你想要的要小得多;而且可能比频繁的模式挖掘没有意义。</p>