Pandas基础设施数据统计图与每个我们的日期

2024-05-28 23:15:40 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图用Pandas显示一些基础设施使用情况的每日统计数据,但我是一个初学者,在经过许多小时的研究后,还是搞不清楚。你知道吗

以下是我的每列数据类型:

Name object UserService object ItemSize int64 ItemsCount int64 ExtractionDate datetime64[ns]

每天我都有一个新的提取为每个用户,所以我可能需要使用组由前绘图。你知道吗

数据样本:

          Name UserService  ItemSize  ItemsCount ExtractionDate
1   xyzf_s        xyfz        40           1     2018-12-12
2    xyzf1        xyzf        53           5     2018-12-12
3    xyzf2        xyzf        71           4     2018-12-12
4    xyzf3        xyzf        91           3     2018-12-12
14   vo12         vo          41           5     2018-12-12

我试图显示的图形之一如下所示:

x轴应为提取日期 y轴应该是项目计数(它被1000除,所以它被从1到100的数千个项目所除) 图中的每一行都应该代表一个用户的进化(为了查看数据峰值),我想我必须显示前10或前50位,因为要有一个1500个用户的图是很困难的。你知道吗

我还对您利用这些数据寻找数据增长和数据消耗异常的任何其他方法感兴趣。你知道吗


Tags: 数据项目用户namepandasobject基础设施情况
1条回答
网友
1楼 · 发布于 2024-05-28 23:15:40

假设用户显示在“名称”列中,并且每个用户每天只有一行,要获得明确要求的绘图,可以使用以下代码:

 # Limit to 10 users
 users_to_plot = df.Name.unique()[:10]
 for u in users_to_plot:
      mask = (df['Name'] == u)
      values = df[mask]
      plt.plot('ExtractionDate','ItemsCount',data=values.sort_values('ExtractionDate'))

重要的是查看数据,并思考您试图提取的信息以及这些信息的外观。这可能是值得探索的一些个人首先得到一个什么是你试图确定的想法。想想是什么让它独特,如果你能使它弹出一个图表。你知道吗

相关问题 更多 >

    热门问题