实际上,我对Python和熊猫还是个新手,不知道该怎么继续下去。
基本概述:我必须创建一个位置推荐系统。我得到了一些带有venueID
和sub(!)categoryID
的foursquare数据。但我的建议应该考虑主要类别的所有数据。所以我必须把主要的类别分配给我的场地。
我的foursquare数据框如下所示:
UserID VenueID CategoryID CategoryName
470 49bbd6c0f964a520f4531fe3 4bf58dd8d48988d127951735 Arts & Crafts Store
979 4a43c0aef964a520c6a61fe3 4bf58dd8d48988d1df941735 Bridge
69 4c5cc7b485a1e21e00d35711 4bf58dd8d48988d103941735 Home (private)
我已经创建了一个包含主要类别及其子类别的数据帧:
^{pr2}$所以基本上我想:如果VenueID's Category ID
(来自foursquare df)在categories_df
中,那么用对应的maincategory ID
写入{
最后,我只想使用主类别作为我的推荐,而不是考虑子类别。
提前谢谢!
签出pandas.DataFrame.merge:
相关问题 更多 >
编程相关推荐