如何过滤数据帧列表中的数字（n>3）？

movie_id user_id rating 0 1 [5, 2, 1, 6] [4, 4, 5, 4] 1 2 [5, 1] [3, 3] 2 3 [1] [4] 3 4 [1] [3] 4 5 [1] [3] 5 6 [1] [5] 6 7 [6, 1] [2, 4] 7 8 [1, 6] [1, 4] 8 9 [1, 6] [5, 4]

movie_id user_id rating approval 0 1 [5, 2, 1, 6][4, 4, 5, 4] {4: 3, 5: 1} 1 2 [5, 1] [3, 3] {3: 2} 2 3 [1] [4] {4: 1} 3 4 [1] [3] {3: 1} 4 5 [1] [3] {3: 1} 5 6 [1] [5] {5: 1} 6 7 [6, 1] [2, 4] {2: 1, 4: 1} 7 8 [1, 6] [1, 4] {1: 1, 4: 1} 8 9 [1, 6] [5, 4] {5: 1, 4: 1}

movie_id user_id rating approval appr_sum 0 1 [5, 2, 1, 6][4, 4, 5, 4] {4: 3, 5: 1} 4 1 2 [5, 1] [3, 3] {3: 2} 0 2 3 [1] [4] {4: 1} 1 3 4 [1] [3] {3: 1} 0 4 5 [1] [3] {3: 1} 0 5 6 [1] [5] {5: 1} 1 6 7 [6, 1] [2, 4] {2: 1, 4: 1} 1 7 8 [1, 6] [1, 4] {1: 1, 4: 1} 1 8 9 [1, 6] [5, 4] {5: 1, 4: 1} 2

3条回答

网友

1楼 · 编辑于 2024-04-25 14:16:18

一个更好的办法是避免列表串联。取而代之的是：

将列表系列扩展到其他列中。你知道吗
将列表系列展开为多行。你知道吗

这两个选项都支持矢量化计算。选择第一个选项：

rats = pd.DataFrame(df.pop('rating').values.tolist()).add_suffix('rat')
appr = appr.join(rats).assign(appr_sum=rats.gt(3).sum(1))

网友

2楼 · 编辑于 2024-04-25 14:16:18

将嵌套列表理解与筛选和sum一起使用：

appr['appr_sum'] = [sum(v for k, v in x.items() if k > 3) for x in appr['approval']]
print (appr)
   movie_id       user_id        rating      approval  appr_sum
0         1  [5, 2, 1, 6]  [4, 4, 5, 4]  {4: 3, 5: 1}         4
1         2        [5, 1]        [3, 3]        {3: 2}         0
2         3           [1]           [4]        {4: 1}         1
3         4           [1]           [3]        {3: 1}         0
4         5           [1]           [3]        {3: 1}         0
5         6           [1]           [5]        {5: 1}         1
6         7        [6, 1]        [2, 4]  {2: 1, 4: 1}         1
7         8        [1, 6]        [1, 4]  {1: 1, 4: 1}         1
8         9        [1, 6]        [5, 4]  {5: 1, 4: 1}         2

网友

3楼 · 编辑于 2024-04-25 14:16:18

表达式不起作用的原因是您对一个系列的迭代不正确。更简单的方法是：

import pandas as pd

df = pd.DataFrame({'A': [1, 3, 4]})

a = [x for _, x in df.iterrows() if x['A'] > 3]
print(a)

> [A]
  [4]

相关问题更多 >

编程相关推荐

热门问题

热门文章