具有字符串列表的Python DataFrame列不会展平

"['Universal Studios', 'Amblin Entertainment', 'Legendary Pictures', 'Fuji Television Network', 'Dentsu']" "['Village Roadshow Pictures', 'Kennedy Miller Productions']" "['Summit Entertainment', 'Mandeville Films', 'Red Wagon Entertainment', 'NeoReel']" "['Lucasfilm', 'Truenorth Productions', 'Bad Robot']" "['Universal Pictures', 'Original Film', 'Media Rights Capital', 'Dentsu', 'One Race Films']" "['Regency Enterprises', 'Appian Way', 'CatchPlay', 'Anonymous Content', 'New Regency Pictures']"

1条回答

网友

1楼 · 发布于 2024-04-25 01:04:39

您可以使用collections.Counter来计数项目。我将任务分为三个步骤：

通过ast.literal_eval将一系列字符串转换为一系列列表。在
使用itertools.chain形成一个iterable of companies并馈送给Counter。在
使用字典理解筛选计数为1的公司。在

下面是一个演示：

from ast import literal_eval
from itertools import chain
from collections import Counter

s = df['companies'].map(literal_eval)
c = Counter(chain.from_iterable(s))
c_filtered = {k for k, v in c.items() if v == 1}

结果：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章