我的数据库里有一个非常大的游戏记录数据集。 假设一个数据帧是其中的一部分,代表一个游戏,如:
+----------+------+------+-------+----------+------------+-----+----------------+
| _id_game | age | rank | grade | time | date | ... | _id_player |
+----------+------+------+-------+----------+------------+-----+----------------+
| key2589 | 14.0 | 1.0 | B | 00:02:34 | 2015/08/02 | ... | maximi-125 |
| key2589 | 28.0 | 2.0 | A | 00:02:50 | 2015/08/02 | ... | scooby-897 |
| key2589 | 16.0 | 3.0 | B | 00:03:21 | 2015/08/02 | ... | zorro-003 |
| key2589 | 30.0 | 4.0 | D | 00:03:45 | 2015/08/02 | ... | barabapapa-007 |
+----------+------+------+-------+----------+------------+-----+----------------+
上面数据框的每一行代表这个游戏的一个玩家。 我想让游戏中所有其他玩家的每一行出现一些特征(这样每个玩家就可以和他的竞争对手进行比较)。你知道吗
我想修改数据帧如下:
+----------+------+------+-------+----------+------------+--------+--------+--------+----------+-----+----------------+
| _id_game | age | rank | grade | time | date | p1_age | p2_age | p3_age | p1_grade | ... | _id_player |
+----------+------+------+-------+----------+------------+--------+--------+--------+----------+-----+----------------+
| key2589 | 14.0 | 1.0 | B | 00:02:34 | 2015/08/02 | 28.0 | 16.0 | 30.0 | A | ... | maximi-125 |
| key2589 | 28.0 | 2.0 | A | 00:02:50 | 2015/08/02 | 14.0 | 16.0 | 30.0 | B | ... | scooby-897 |
| key2589 | 16.0 | 3.0 | B | 00:03:21 | 2015/08/02 | 14.0 | 28.0 | 30.0 | B | ... | zorro-003 |
| key2589 | 30.0 | 4.0 | D | 00:03:45 | 2015/08/02 | 14.0 | 28.0 | 16.0 | B | ... | barabapapa-007 |
+----------+------+------+-------+----------+------------+--------+--------+--------+----------+-----+----------------+
如您所见,我不会复制日期或id游戏的字段。只是具体的领域有哪些球员的特点。你知道吗
其主要思想是对一个领域进行预测,考虑到其他竞争者对每一行所代表的个体的存在。你知道吗
我不知道如何在一个熊猫数据帧考虑到一个df只是一个游戏。考虑到数据帧包含一堆游戏,这就更复杂了。你知道吗
有人来帮我吗?你知道吗
这是一个交叉连接问题,在连接之后我们需要过滤器排除每行的重复项,然后重新格式化输出
这里只需要
merge
返回原始数据帧检查link相关问题 更多 >
编程相关推荐