如何在pydatadab中使用groupby统计每个类别的实例数

2024-06-17 18:43:19 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个如下所示的数据帧,这里我想对它应用groupby和count操作,以pydatatable的方式获取每个类别的计数?。你知道吗

下面是一个包含不同编程语言的示例

prog_lang_dt = dt.Frame({"languages": ['html','R','R','html','R','javascript','R','javascript','html']})

下面是一个代码,我正在尝试应用组和计数操作

prog_lang_dt[:,:,by(f.languages)]

有没有什么计数特定的函数来代替J。。。DT[i,j,by]


Tags: 数据langbyhtmlcount方式dtjavascript
1条回答
网友
1楼 · 发布于 2024-06-17 18:43:19

count()方法可用于查找每组中的元素数:

from datatable import dt, f, by, count

prog_lang_dt = dt.Frame(languages= ['html', 'R', 'R', 'html', 'R', 'javascript',
                                    'R', 'javascript', 'html'])
prog_lang_dt[:, count(), by(f.languages)]

产生

   | languages   count
  +          -
 0 | R               4
 1 | html            3
 2 | javascript      2

[3 rows x 2 columns]

虽然您的示例不需要,但是函数count也可以将列作为参数,在这种情况下,它将报告该特定列中未丢失的条目数。你知道吗

相关问题 更多 >