设置间距(标签、值)

2024-04-25 18:02:31 发布

您现在位置:Python中文网/ 问答频道 /正文

我不得不说,我是一个处理数据帧的初学者,我非常感谢任何提示:)

我有一个包含文件名和大小的数据框(~8000条记录)。我试图找出哪些文件可以删除或移动。所以我试着画出名字和大小。你知道吗

问题:

标签和(最可能的是行也重叠,即使我使用了linewidth属性)

基本上,我使用的代码

>>> g = sns.barplot(y='size',x='files',data=df)
>>> for item in g.get_xticklabels():
...     item.set_rotation(45)

结果 enter image description here

samller sample上具有linewidth属性的代码

>>> g = sns.barplot(y='size',x='files',data=dfs, linewidth=2)
>>> for item in g.get_xticklabels():
...     item.set_rotation(90)

结果呢 enter image description here

我正在使用python3.5和OS 10.11.6


Tags: 数据代码infordatasizeget属性
1条回答
网友
1楼 · 发布于 2024-04-25 18:02:31

正如我在评论中所说,我不认为图表是最好的方法。我将首先简化数据帧以获得每个文件的平均大小:

average_size = df.groupby('files')['size'].mean()

然后,您可以通过以下方法获得前10个文件(例如):

average_size.nlargest(10, columns='size')

相关问题 更多 >