我有一个表包含关键字及其每年出现的次数,但如果它在某些年份没有出现,这些年份就会丢失。你知道吗
但是我现在需要用零来填充那些年,我怎么能用熊猫数据帧呢?你知道吗
我的数据如下表所示,从2003年到2015年的13年内,每个关键字都应该加零。你知道吗
+---------+------+-------+ | keyword | year | count | +---------+------+-------+ | a | 2003 | 1 | | a | 2004 | 2 | | b | 2003 | 1 | | b | 2005 | 2 | +---------+------+-------+
期望结果:
+---------+------+-------+ | keyword | year | count | +---------+------+-------+ | a | 2003 | 1 | | a | 2004 | 2 | | a | 2005 | 0 | | a | 2006 | 0 | | a | 2007 | 0 | | a | 2008 | 0 | | a | 2009 | 0 | | a | 2010 | 0 | | a | 2011 | 0 | | a | 2012 | 0 | | a | 2013 | 0 | | a | 2014 | 0 | | a | 2015 | 0 | | b | 2003 | 1 | | b | 2004 | 0 | | b | 2005 | 2 | | b | 2006 | 0 | | ... | ... | ... | +---------+------+-------+
我该怎么做?我搜索了StackOverflow,只在不重复的日期找到了答案,但在这里我的岁月在重复。你知道吗
您可以通过^{} 创建新的} 和^{} 将列转换为
MultiIndex
,然后通过^{MultiIndex
:另一种解决方案是通过^{} 和^{} 创建新的} 修复缺少的值:
DataFrame
,使用左连接,最后通过^{相关问题 更多 >
编程相关推荐