熊猫：行数计数错误

1条回答

网友

1楼 · 发布于 2024-05-29 04:53:49

覆盖将有所帮助。使用以下代码行：

result_df = result_df[result_df['_text'].apply(textstat.lexicon_count) != 0]
len(result_df)

网友

2楼 · 发布于 2024-05-29 04:53:49

您所做的只是使用布尔索引获得原始数据帧的视图。没有变化。例如：

In [108]: df
Out[108]: 
   colx  coly name
0     1     5  foo
1     2     6  foo
2     3     7  bar
3     4     8  bar

In [109]: len(df)
Out[109]: 4

现在，索引以查找colx>；3的所有行：

In [110]: df[df['colx'] > 3]
Out[110]: 
   colx  coly name
3     4     8  bar

In [111]: len(df[df['colx'] > 3])
Out[111]: 1

但是，如果打印出原始df：

In [112]: df
Out[112]: 
   colx  coly name
0     1     5  foo
1     2     6  foo
2     3     7  bar
3     4     8  bar

如果要将数据帧重新分配给切片，则需要显式分配它：

result_df = result_df[result_df['_text'].apply(textstat.lexicon_count) != 0]