Pandas：数数

from timeit import Timer setup = "import pandas; male_trips=pandas.load('maletrips')" a = "male_trips.start_station_id.value_counts()" b = "male_trips.groupby('start_station_id').size()" Timer(a,setup).timeit(100) Timer(b,setup).timeit(100)

3条回答

网友

1楼 · 编辑于 2024-06-16 12:07:23

我喜欢Vishal，但不想使用sum（）using size（）来获取分配给每组“start_station_I d”的行数。所以：

df = male_trips.groupby('start_station_id').size()

网友

2楼 · 编辑于 2024-06-16 12:07:23

我下面的答案适用于熊猫0.7.3。对新版本不太确定。

这就是pandas.Series.value_counts方法的用途：

count_series = male_trips.start_station_id.value_counts()

然后根据stations['id']中的值直接检查count_series。但是，如果您坚持只考虑这些值，您可以执行以下操作：

count_series = (
                male_trips[male_trips.start_station_id.isin(stations.id.values)]
                    .start_station_id
                    .value_counts()
               )

这只会给出在stations.id中实际找到的站点ID的计数。

网友

3楼 · 编辑于 2024-06-16 12:07:23

male_trips.count()

不工作？ http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.count.html

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas：数数

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >