我是Python新手(使用anacondaw/pythonv3.4.3),还没有找到这个答案,但这似乎是一个非常重要的问题,我一定是走错了方向
import pandas as pd
url = 'https://raw.github.com/pydata/pandas/master/pandas/tests/data/tips.csv'
tips = pd.read_csv(url)
tips.head(5)
Out[1]:
total_bill tip sex smoker day time size
0 16.99 1.01 Female No Sun Dinner 2
1 10.34 1.66 Male No Sun Dinner 3
2 21.01 3.50 Male No Sun Dinner 3
3 23.68 3.31 Male No Sun Dinner 2
4 24.59 3.61 Female No Sun Dinner 4
我想选择day
组中至少有50条记录的记录
sel_days = tips.groupby("day").size() > 50
sel_days
Out[2]:
day
Fri False
Sat True
Sun True
Thur True
dtype: bool
我看到这是一个序列,但似乎不知道如何生成一个布尔序列来从原始集合tips
中选择行
type(sel_days)
Out[3]: pandas.core.series.Series
print(x in sel_days for x in tips["day"])
<generator object <genexpr> at 0x0000000007DBDFC0>
我该怎么做
我将向映射布尔掩码的
tips
数据帧添加一个新列:然后仅选择真值:
您想^{} :
相关问题 更多 >
编程相关推荐