我需要计算每个domain
中唯一的ID
值
我有数据
ID, domain
123, 'vk.com'
123, 'vk.com'
123, 'twitter.com'
456, 'vk.com'
456, 'facebook.com'
456, 'vk.com'
456, 'google.com'
789, 'twitter.com'
789, 'vk.com'
我试着df.groupby(['domain', 'ID']).count()
但我想得到
domain, count
vk.com 3
twitter.com 2
facebook.com 1
google.com 1
df.domain.value_counts()
你需要^{} :
如果需要^{}
'
字符:或按Jon Clements注释:
您可以这样保留列名:
区别在于
nunique()
返回一个序列,而agg()
返回一个数据帧。通常,要计算单个列中的不同值,可以使用^{} :
要查看列中有多少唯一值,请使用^{} :
要获得所有这些不同的值,可以使用^{} 或^{} ,这两个函数之间的细微差别是
unique
返回一个numpy.array
,而drop_duplicates
返回一个pandas.Series
:对于这个特定的问题,由于您希望对另一个变量计算不同的值,除了这里其他答案提供的
groupby
方法外,您还可以先删除重复项,然后再执行value_counts()
:相关问题 更多 >
编程相关推荐