擅长:python、mysql、java
<p>我不认为有一个“非常”简单的方法来做你想做的事。但也不太复杂</p>
<p>首先,您需要明确定义~标准,以确定哪些名称是相同的“公司”。
我们可以尝试“获得第一世界,看看它是否匹配”,显然这不是一个完美的方法,但现在就可以了</p>
<p>然后,您可以创建一个对象来存储新数据。我推荐一本字典,里面有<code>company: (total employees)</code>这样的词条</p>
<p>现在,您将使用apply和一个函数遍历数据帧的行,以执行您想要的操作。看起来是这样的:</p>
<pre><code>dict = {}
def aggregator(row):
word1 = row.company.split(" ")[0]
if word1 in dict.keys:
dict[word1] += row.employees
else:
dict[word1] = row.employees
dataframe.apply(aggregator, axis = 1)
</code></pre>