Python:subp中异常值的数据可视化

2024-03-29 13:02:27 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用以下csv文件:file1file2

绘制以下子图:

enter image description here

生成子批次的代码如下:

df = {}
df[1] = pd.read_csv('file1.csv')
df[2] = pd.read_csv('file1.csv')

fig, axes = plt.subplots(1, 2, figsize=(10, 5), sharey=True)
for bet in [[1, 0], [2, 1]]:
    betas = reg[bet[0]]
    betas = betas.ix[int_col]
    betas.dropna(inplace=1)
    betas.index = range(25)
    ax = betas.plot(ax=axes[bet[1]], grid=False,  style=['b-', 'b--', 'b--'],
                    legend=None)
    ax.lines[0].set_linewidth(1.5)
    ax.lines[1].set_linewidth(0.6)
    ax.lines[2].set_linewidth(0.6)
    ax.axhline(y=0, color='k', linestyle='-', alpha=0.25, linewidth=0.5)
    ax.axvline(x=13, color='k', linestyle='-', alpha=0.25, linewidth=0.5)
    ax.set_xticks([0, 6, 13, 19, 24])

这些图显示了回归系数(蓝色实线)和置信区间(虚线)。 如您所见,子图中的两个图都有异常值。。。x=0处的第一个点。 离群值很重要,但它“变形”了我的图,其他点似乎在一条直线上,但实际上在x>;0处有重要的变化。在

在x>;0处,什么样的数据可视化既能显示异常值,又能更好地“缩放”其他点。断裂的y轴是最好的方法吗?我如何在子批次中这样做?其他建议?在


Tags: csvalphadfreadaxfile1colorpd