我有这样一个数据帧:
date sales company country
16/03/2012 3000 H&M US
13/04/2012 2300 H&M US
26/03/2012 1230 H&M FR
13/04/2012 1300 H&M FR
23/03/2012 2230 H&M IT
19/04/2012 1100 H&M IT
16/03/2012 3000 ABC US
13/04/2012 2300 ABC US
26/03/2012 100 ABC FR
13/04/2012 60 ABC FR
23/03/2012 435 ABC IT
19/04/2012 300 ABC IT
我想定义一个标准:如果一家公司的销售额(平均)不到50%来自同一个国家,那么它就被认为是国际性的。我想创建一个新列,如果它是国际性的,则值为1,否则为0。最终输出应如下所示:
date sales company country international
16/03/2012 3000 H&M US 1
13/04/2012 2300 H&M US 1
26/03/2012 1230 H&M FR 1
13/04/2012 1300 H&M FR 1
23/03/2012 2230 H&M IT 1
19/04/2012 1100 H&M IT 1
16/03/2012 3000 ABC US 0
13/04/2012 2300 ABC US 0
26/03/2012 100 ABC FR 0
13/04/2012 60 ABC FR 0
23/03/2012 435 ABC IT 0
19/04/2012 300 ABC IT 0
我怎么能这么做? 注:数据集中可能缺少销售值,我怎么能说忽略这些值呢?你知道吗
使用^{} 作为平均值,将它们和groupby与aggregate
all
进行比较,检查是否所有值都返回True
:相关问题 更多 >
编程相关推荐