我有一个数据帧,希望循环遍历c2列中的所有字符串,打印该字符串和它在c2列中出现的年份,然后还打印它在c1列中出现时的第一年,如果它在c1列中存在的话。然后在另一列中统计年份之间的差异c2中存在NaN值。
示例df:
id year c1 c2
0 1999 luke skywalker han solo
1 2000 leia organa r2d2
2 2001 han solo finn
3 2002 r2d2 NaN
4 2004 finn c3po
5 2002 finn NaN
6 2005 c3po NaN
打印结果示例:
c2 year in c2 year in c1 delta
han solo 1999 2001 2
r2d2 2000 2002 2
finn 2001 2004 3
c3po 2004 2005 1
我正在使用Python和熊猫的Jupyter笔记本。谢谢
您可以按如下步骤进行操作:
输出:
这里有一个方法
解释
c1
映射到year
,按“第一个”聚合李>c2
上使用此映射计算year_c1
李>delta
作为year_c2
和year_c1
之间的差值李>c2
和order列中带有null
的行李>相关问题 更多 >
编程相关推荐