我有几个sns的URLpost
,并且每天都在跟踪它的readCount
、likeCount
、commentCount
等等
这是我使用pandas获得的数据帧:
post_url nickname date_key readCount likeCount commentCount
5 a_url user1 2020-06-12 2874.0 194 NaN
4 a_url user1 2020-06-13 4030.0 208 48.0
6 a_url user1 2020-06-14 NaN 220 48.0
7 a_url user1 2020-06-15 NaN 223 48.0
0 b_url user2 2020-06-13 16882.0 295 88.0
2 b_url user2 2020-06-14 NaN 296 88.0
3 b_url user2 2020-06-15 NaN 299 88.0
我想要达到的结果是(请不要介意实际值,因为它们是即兴创作的):
post_url nickname type 2020-06-12 2020-06-13 2020-06-14 2020-06-15
5 a_url user1 readCount 2874.0 3074.0 NaN NaN
4 a_url user1 likeCount 4030.0 4334.0 4888.0 7463.0
6 a_url user1 commentCount NaN 220 48.0 59.0
1 b_url user2 readCount NaN 194 NaN NaN
3 b_url user2 likeCount NaN 208 88.0 493.0
2 b_url user2 commentCount NaN 220 53.0 292.0
请注意,每个post
都有不同的date_key
子集,我的目标是将所有现有的date_key
合并到列中
关于这个主题,我已经尝试过搜索,但是没有找到完全相同的用例
你能给我一个实现这个目标的方法吗? 多谢各位
使用^{} 表示unpivot,然后使用^{} 表示通过
mean
聚合的一般解决方案,如果可能,每列重复post_url,nickname,type,date_key
:另一个想法是,如果不需要使用^{} 和^{} 进行聚合:
相关问题 更多 >
编程相关推荐