我把熊猫放在笔记本里。我有一个数据帧result_df
,包含一列_text
。我试图筛选出满足某个条件的行(特别是那些结果中的字数为0的行)。你知道吗
当我开始的时候,我有一个:
len(result_df)
我回来了:
49708
然后我做这个:
result_df[result_df['_text'].apply(textstat.lexicon_count) != 0]
在笔记本中,我看到一个巨大的数据框,底部是这样的:
49701 rows × 5 columns
但是,当我跑步时:
len(result_df)
我回来了:
49708
所以现在我很困惑:看起来我删除了7行,但是len
函数不同意。。。你知道吗
任何澄清都太棒了!你知道吗
谢谢!你知道吗
覆盖将有所帮助。使用以下代码行:
您所做的只是使用布尔索引获得原始数据帧的视图。没有变化。例如:
现在,索引以查找
colx
>;3的所有行:但是,如果打印出原始df:
如果要将数据帧重新分配给切片,则需要显式分配它:
相关问题 更多 >
编程相关推荐