在Graphlab或Python中查找特定行

2024-04-18 23:56:12 发布

您现在位置:Python中文网/ 问答频道 /正文

在Graphlab

我正在处理一个大名单中的一小部分电影。在

  movieIds_5K_np = LL_features_SCD_min.to_numpy()[:,0]
  ratings_33K_np = ratings_33K.to_numpy()

movieIds_5K_np是一个包含我的movieid的数组。`ratings_33K_np'是一个包含四列的数组,第二列包含所有电影的电影ID。在

我只需要选择ratings_33K_np中id存在于“movieIds_5K\u np”中的行。在

我尝试过这种方法,但似乎不起作用:

^{pr2}$

如何在Graphlab中或通过使用一些Python库来做到这一点?我应该说,最初ratings_33K和{}是作为SFrame导入的。在

谢谢


Tags: tonumpyid电影np数组minfeatures
1条回答
网友
1楼 · 发布于 2024-04-18 23:56:12

假设您有2个sframe,您可以做一个join,如下所示:

ratings_5K = LL_features_SCD_min[['id_column_name']].join(ratings_33K, on='id_column_name', how='left')

据我从您的代码中了解,LL_features_SCD_min是与您的ministet(5K数据)相对应的sframe。因此,您只需获取所需的id并将它们与整个数据集连接,从而获得一个新的sframe,其中只包含您想要的id。只需替换您的id列名就可以了。在

有关join如何在graphlab中工作的详细信息,请考虑检查SFrame上的documentation。在

祝你好运!在

相关问题 更多 >