仅从Pandas Datafram获取相关数据

2024-04-28 07:29:04 发布

您现在位置:Python中文网/ 问答频道 /正文

背景简介:我最近刚开始使用Pandas来读取csv文件中的数据。我可以通过读取csv来创建一个dataframe,但是现在我只想使用数据集的特定列进行一些计算。在

有没有一种方法可以创建一个新的数据帧,我只使用相关列不是NA或0的行?例如,假设一个数组如下所示:

   blah  blah1  blah2  blah3
0    1     1      1      1
1   NA    NA      1     NA
2    1     1      1      1

假设我想处理“blah1”和“blah2”列下的数据,但我只想使用第0行和第2行,因为1在“blah”列下有一个NA。在

有简单的方法吗?谢谢!在

编辑(澄清): -我不知道我想删除第1行,因此我需要能够检查NA值(可能还有除了是否为null之外的任何其他占位符值)。在


Tags: 文件csv数据方法编辑dataframepandas数组
1条回答
网友
1楼 · 发布于 2024-04-28 07:29:04

是的,您可以使用dropna

df = df.dropna(axis = 1)

要选择列,请使用以下命令:

^{pr2}$

现在df只包含列"blah1"和{}以及02

编辑1

要将NaN验证限制为某些列,可以使用isnull()。在

mask = df[["blah1", "blah2"]].isnull().all(axis=1)
df = df[~mask]

编辑2

^{4}$

相关问题 更多 >