如何使用点绘制Pandas数据帧的两列?

2024-03-28 19:23:17 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个pandas数据框,希望将一列的值与另一列的值进行比较。幸运的是,有一个plot方法与数据帧相关联,似乎可以完成我需要的任务:

df.plot(x='col_name_1', y='col_name_2')

不幸的是,在绘图样式中(在kind参数后面列出的here)似乎没有点。我可以用线或条,甚至密度,但不能用点。有什么办法可以帮助解决这个问题吗。


Tags: 数据方法name绘图pandasdf参数here
3条回答

调用^{}时,可以指定绘制线的style

df.plot(x='col_name_1', y='col_name_2', style='o')

参数style也可以是dictlist,例如:

import numpy as np
import pandas as pd

d = {'one' : np.random.rand(10),
     'two' : np.random.rand(10)}

df = pd.DataFrame(d)

df.plot(style=['o','rx'])

所有接受的样式格式都列在^{}的文档中。

Output

Pandas使用matplotlib作为基本绘图的库。在您的案例中,最简单的方法是使用以下内容:

import pandas as pd
import numpy as np

#creating sample data 
sample_data={'col_name_1':np.random.rand(20),
      'col_name_2': np.random.rand(20)}
df= pd.DataFrame(sample_data)
df.plot(x='col_name_1', y='col_name_2', style='o')

enter image description here

但是,如果您希望在不进入matplotlib.基本级别的情况下有更多自定义绘图,我建议使用seaborn作为替代解决方案。在这种情况下,您的解决方案如下:

import pandas as pd
import seaborn as sns
import numpy as np

#creating sample data 
sample_data={'col_name_1':np.random.rand(20),
      'col_name_2': np.random.rand(20)}
df= pd.DataFrame(sample_data)
sns.scatterplot(x="col_name_1", y="col_name_2", data=df)

enter image description here

为了这个(以及大多数的阴谋),我不会依赖matplotlib的熊猫包装器。相反,直接使用matplotlib:

import matplotlib.pyplot as plt
plt.scatter(df['col_name_1'], df['col_name_2'])
plt.show() # Depending on whether you use IPython or interactive mode, etc.

记住,您可以使用df.col_name_1.values访问列值的NumPy数组。

我在使用Pandas默认绘图时遇到了问题,在时间戳值列的情况下,它的精度为毫秒。在尝试将对象转换为datetime64类型时,我还发现了一个令人讨厌的问题:<;Pandas gives incorrect result when asking if Timestamp column values have attr astype>;。

相关问题 更多 >