不同长度列的Python boxplot

2024-06-01 03:57:58 发布

您现在位置:Python中文网/ 问答频道 /正文

我在Python中有以下数据帧(实际的数据帧要大得多,只是提供了一个小示例):

      A     B     C     D     E     F
0  0.43  0.52  0.96  1.17  1.17  2.85
1  0.43  0.52  1.17  2.72  2.75  2.94
2  0.43  0.53  1.48  2.85  2.83  
3  0.47  0.59  1.58        3.14  
4  0.49  0.80        

我使用df.values将数据帧转换为numpy,然后将其传递给boxplot。

当我试图用这个pandas数据框绘制一个boxplot时,从每一列中选取的值的数量被限制为一列中的最小值(在本例中是F列)。是否有任何方法可以将每列中的所有值装箱?

注意:我使用df.dropna来删除每列中缺少值的行。然而,这是将数据帧调整到列长度的最小公分母,并扰乱绘图。

import prettyplotlib as ppl
import numpy as np
import pandas
import matplotlib as mpl
from matplotlib import pyplot

df = pandas.DataFrame.from_csv(csv_data,index_col=False)
df = df.dropna()
labels = ['A', 'B', 'C', 'D', 'E', 'F']
fig, ax = pyplot.subplots()
ppl.boxplot(ax, df.values, xticklabels=labels)
pyplot.show()

Tags: csv数据fromimportnumpypandasdflabels
1条回答
网友
1楼 · 发布于 2024-06-01 03:57:58

正确的方法是使用pandas中的.boxplot(),这样nan就可以正确处理:

In [31]:

print df
      A     B     C     D     E     F
0  0.43  0.52  0.96  1.17  1.17  2.85
1  0.43  0.52  1.17  2.72  2.75  2.94
2  0.43  0.53  1.48  2.85  2.83   NaN
3  0.47  0.59  1.58   NaN  3.14   NaN
4  0.49  0.80   NaN   NaN   NaN   NaN

[5 rows x 6 columns]
In [32]:

_=plt.boxplot(df.values)
_=plt.xticks(range(1,7),labels)
plt.savefig('1.png') #keeping the nan's and plot by plt

enter image description here

In [33]:

_=df.boxplot()
plt.savefig('2.png') #keeping the nan's and plot by pandas

enter image description here

In [34]:

_=plt.boxplot(df.dropna().values)
_=plt.xticks(range(1,7),labels)
plt.savefig('3.png') #dropping the nan's and plot by plt

enter image description here

相关问题 更多 >