我有一份公司及其子公司的名单,数据如下:
CompanyName Employees
Microsoft China 1
Microsoft India 1
Microsoft Europe 1
Apple Inc 1
Apple Data Inc 1
Apple Customer Service Inc 1
Data Corp 1
Data SHCH 1
Data India 1
City Corp 1
Data City 1
如果两个公司有相同的词(例如苹果公司和苹果数据公司),则它们被视为一个公司。我将这些公司归为一组,并计算它们的员工总数
The expected return should be:
Company Employees
Microsft 3
Apple 3
Data 3
City 2
在这种情况下,熊猫的大部分功能实际上不起作用。关于For Loop有什么建议吗?
CompanyName
中的第一个单词我不认为有一个“非常”简单的方法来做你想做的事。但也不太复杂
首先,您需要明确定义~标准,以确定哪些名称是相同的“公司”。 我们可以尝试“获得第一世界,看看它是否匹配”,显然这不是一个完美的方法,但现在就可以了
然后,您可以创建一个对象来存储新数据。我推荐一本字典,里面有
company: (total employees)
这样的词条现在,您将使用apply和一个函数遍历数据帧的行,以执行您想要的操作。看起来是这样的:
相关问题 更多 >
编程相关推荐