在列表列中计算唯一元素的有效方法？

2条回答

网友

1楼 · 编辑于 2024-06-16 10:41:58

例如，您可以使用下一个变体：

from itertools import chain
from operator import methodcaller

import pandas as pd

df = pd.DataFrame({
    "words": [
        "we like to party",
        "can can dance",
        "yes we can"
    ]
})

print(len(set(
    chain.from_iterable(
        map(methodcaller("split", " "), df.words.values)
    )
)))

网友

2楼 · 编辑于 2024-06-16 10:41:58

我认为您需要由连接词和拆分词创建的集合长度：

a = len(set(' '.join(df['words']).split()))
print (a)
7

如果有使用集合理解的列表，谢谢@juanpa.arrivillaga:

print (df)
                   words
0  [we, like, to, party]
1      [can, can, dance]
2         [yes, we, can]


a = len({y for x in df['words'] for y in x})
print (a)
7

编程相关推荐

java嵌套循环打印一个数字，旁边有相同数量的星号
java JodReports替代方案
java如何将模型类parcelable对象从片段传递到活动？
java JCS缓存删除功能不删除特定元素
如何打开。Java的dll文件。
java在这种情况下如何选择聚合根？
java从CellEditorListener获取编辑的TreeNode
Java到web服务和mysql
从openssl ec在Java中创建公钥时出现加密无效密钥异常
Java数组：添加多个数组的元素时忽略空数组

相关问题更多 >

编程相关推荐

热门问题

热门文章

在列表列中计算唯一元素的有效方法？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >