一段时间内类别的水平条形图

2024-05-13 00:26:34 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前有一个数据集,其中每一行有效或无效,有效性由一列声明,该列为True或False

数据集的一个示例可以在下面的代码段中可视化:

                TimeStamp  Avg. Values  ... Validity
0     2015-02-14 20:30:00      5.1736  ...     False  
1     2015-02-14 20:40:00      16.6266  ...    True   
2     2015-02-14 20:50:00      12.7667  ...    True   
3     2015-02-14 21:00:00      11.6077  ...    False   
4     2015-02-14 21:10:00       19.6851  ...   True   
                  ...          ...  ...         ...    
1000 2015-06-12 23:30:00       1.699  ...      True  
1001 2015-06-12 23:40:00       2.2468  ...     False  
1002 2015-06-12 23:50:00       3.1147  ...     False  
1003 2015-06-13 00:00:00       6.141  ...      True  
1004 2015-06-13 00:10:00       3.792  ...      True  

我的目标是在考虑列有效性的情况下,绘制有效性,就像甘特图一样。所以我的想法是,我将生成水平条,指示一段时间内数据的类别。我编了一个例子,没有反映上述数据,但它说明了我想要实现的是:

enter image description here

到目前为止,我看到的大多数水平条形图只显示每个类别的数据量。那么,是否有可能以某种方式将其绘制为甘特图,显示随时间变化的类别


Tags: 数据falsetrue声明示例可视化代码段水平
1条回答
网友
1楼 · 发布于 2024-05-13 00:26:34

使用plt.barh可以指示所有开始位置,使用10分钟作为条形图的宽度。将非通缉位置着色为“无”:

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.dates as mdates
import numpy as np

dates = pd.date_range(start='2020-02-14 20:30', end='2020-02-24', freq='10min')
data = pd.DataFrame({'Timestamp': dates,
                     'Validity': (np.round(np.random.uniform(0, .02, len(dates)).cumsum()) % 2).astype(bool)})
color = 'dodgerblue'
plt.barh(y=1, left=data['Timestamp'], width=1/24/6, height=0.3,
         color=['none' if not val else color for val in data['Validity']])
plt.axhline(1, color=color)
plt.barh(y=0, left=data['Timestamp'], width=1/24/6, height=0.3, color=['none' if val else color for val in data['Validity']])
plt.axhline(0, color=color)

plt.gca().xaxis.set_major_locator(mdates.AutoDateLocator())
plt.gca().xaxis.set_major_formatter(mdates.DateFormatter('%d-%b'))
plt.yticks([0, 1], ['False', 'True'])
# plt.xticks(rotation=30)
plt.margins(y=0.4)
plt.ylabel('Validity')
plt.xlabel('Timestamp')
plt.tight_layout()
plt.show()

example plot

这里有一个稍微复杂一点的方法,它允许不规则的时间戳

首先将布尔列转换为整数(0表示false1表示true)。然后计算连续条目之间的差异。这将在值保持不变时显示零,其中a False翻转为a True,a +1翻转回False。发生这种情况的索引可用于索引时间戳。为了避免第一个和最后一个索引出现问题,需要在数组的起始端追加一个伪值

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.dates as mdates
import numpy as np


dates = pd.date_range(start='2020-02-14 20:30', end='2020-02-24', freq='10min')
data = pd.DataFrame({'Timestamp': dates,
                     'Validity': (np.round((np.random.uniform(0, .02, len(dates))).cumsum()) % 2).astype(bool)})

tm = data['Timestamp'].to_numpy()
tm = np.append(tm, tm[-1])

color = 'navy'
steps_true = np.diff(np.concatenate([[False], data['Validity'], [False]]).astype(int))
plt.barh(y=1, left=tm[np.flatnonzero(steps_true == 1)], height=0.2,
         width=tm[np.flatnonzero(steps_true == -1)] - tm[np.flatnonzero(steps_true == 1)], color=color)
plt.axhline(1, color=color)
steps_false = np.diff(np.concatenate([[True], data['Validity'], [True]]).astype(int))
plt.barh(y=0, left=tm[np.flatnonzero(steps_false == -1)], height=0.2,
         width=tm[np.flatnonzero(steps_false == 1)] - tm[np.flatnonzero(steps_false == -1)], color=color)
plt.axhline(0, color=color)

plt.gca().xaxis.set_major_locator(mdates.AutoDateLocator())
plt.gca().xaxis.set_major_formatter(mdates.DateFormatter('%d-%b'))
plt.yticks([0, 1], ['False', 'True'])
plt.margins(y=0.4)
plt.ylabel('Validity')
plt.xlabel('Timestamp')
plt.tight_layout()
plt.show()

second plot

相关问题 更多 >