我有房地产数据:
neighborhood type_property type_negotiation price
Smallville house rent 2000
Oakville apartment for sale 100000
King Bay house for sale 250000
...
我有一个groupby,它确定了数据集中哪些值是待售房屋,然后在一个名为df\u-breakdown的新数据框中返回每个街区这些房屋的第10百分位和第90百分位以及数量。结果如下:
neighborhood tenthpercentile ninetiethpercentile Quantity
King Bay 250000.0 250000.0 1
Smallville 99000.0 120000.0 8
Oakville 45000.0 160000.0 6
...
我现在想把这些信息带回我的原始房地产数据集,并过滤掉所有的上市,如果它是一个出售的房子超过百分之九十或低于百分之十相对于百分之计算每个街区。例如,我想在奥克维尔社区买一套价格35万的房子
我以前用过这个论点:
df1 = df[df.price < df.price.quantile(.90)]
但我不知道如何利用它来为每个邻里提供不同的值,甚至不知道它是否有用。事先谢谢你的帮助
可能不是最优雅的,但你可以加入百分位聚合到每个房地产数据
在手机上,如果语法不完美,请原谅我
您可以将它们设置为具有相同的索引,广播百分位数,并且只需使用
.between
所以首先
然后,
broadcast
使用loc
最后
这就产生了
所以要过滤,就切片
相关问题 更多 >
编程相关推荐