当我更改python数据框中的索引时，matplotlib图表会更改

网友
1楼 · 编辑于 2024-04-25 23:22:07

将df['Date']视为float不是一个好主意。它应该被转换成熊猫。这可以使用pandas^{}方法实现
试试这个：
import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('ie_data.csv') df=df[['Date','Price']] df.dropna(inplace=True) #converting to pandas datetime format df['Date'] = df['Date'].astype(str).map(lambda x : x.split('.')[0] + x.split('.')[1]) df['Date'] = pd.to_datetime(df['Date'], format='%Y%m') df.set_index(['Date'],inplace=True) #plotting df.plot() #full data plot df.tail(100).plot() #plotting just the tail plt.title("S&P500 Composite Historical Data") plt.xlabel("Date") plt.ylabel("Price") plt.show()
输出：

网友
2楼 · 编辑于 2024-04-25 23:22:07

我认为您的问题在于，您的日期是浮点型的，将其作为x轴完全符合将([2012.01, 2012.02, ..., 2012.12, 2013.01....])类型的数组作为x轴的预期。您可以先将Date列转换为DateTimeIndex，然后使用内置的plot方法：
df["Price"].tail(100).plot()

网友
3楼 · 编辑于 2024-04-25 23:22:07

最简单的方法是将日期转换为实际的日期时间索引。这样matplotlib将自动拾取并相应地绘制它。例如，给定日期格式，您可以执行以下操作：

df["Date"] = pd.to_datetime(df["Date"].astype(str), format='%Y.%m')
df = df.set_index("Date")
plt.plot(df["Price"].tail(100))

目前，您显示的第一个绘图实际上是针对index绘制Price列，这似乎是一个从0到1800的常规范围索引。您建议您的数据始于1981年，因此尽管每个观测值在x轴上的间隔是均匀的（间隔为1，即从一个索引值跳到下一个索引值）。这就是为什么图表看起来合理。然而，x轴的值却没有

现在，当您将Date（作为float）设置为索引时，请注意，您没有均匀地覆盖1981年和1982年之间的间隔。在1981.1到1981.12之间有均匀分布的值，但在1981.12到1982之间没有。这就是为什么第二张图表也按预期绘制。如上所述将索引设置为DatetimeIndex应该可以消除此问题，因为Matplotlib将知道如何沿x轴均匀地间隔日期

相关问题更多 >

编程相关推荐

热门问题

热门文章