<p>从技术上讲,这不是一个编程问题,而是一个数学问题。但我认为你最好用方差协方差矩阵。或相关矩阵,如果值的比例非常不同,例如,而不是:</p>
<pre><code>>>> x
array([[5, 3, 0],
[3, 0, 5],
[5, 5, 0],
[1, 1, 7]])
</code></pre>
<p>你有:</p>
<pre><code>>>> x
array([[5, 300, 0],
[3, 0, 5],
[5, 500, 0],
[1, 100, 7]])
</code></pre>
<p>要获得方差cov矩阵:</p>
<pre><code>>>> np.cov(x)
array([[ 6.33333333, -3.16666667, 6.66666667, -8. ],
[ -3.16666667, 6.33333333, -5.83333333, 7. ],
[ 6.66666667, -5.83333333, 8.33333333, -10. ],
[ -8. , 7. , -10. , 12. ]])
</code></pre>
<p>或相关矩阵:</p>
<pre><code>>>> np.corrcoef(x)
array([[ 1. , -0.5 , 0.91766294, -0.91766294],
[-0.5 , 1. , -0.80295507, 0.80295507],
[ 0.91766294, -0.80295507, 1. , -1. ],
[-0.91766294, 0.80295507, -1. , 1. ]])
</code></pre>
<p>这是观察它的方法,对角线单元,即<code>(0,0)</code>单元,是X中第一个向量与其自身的相关性,所以它是1。其他细胞,即<code>(0,1)</code>细胞,是X中第1和第2个向量之间的相关性,它们呈负相关。或者类似地,第1和第3个细胞是正相关的。</p>
<p>协方差矩阵或相关矩阵避免了由@Akavall指出的零问题。</p>