我有一个dataframe,它在建筑物数据集上具有多种属性。这些建筑都被分配到一个住宅组(公寓/半独立住宅/独立住宅/梯田住宅)和一个小区号。这些建筑也有一个“建筑年份”栏,但除了面积较小(约80栋建筑)外,没有唯一的标识
我想写一个for循环,将这些建筑分组到它们的住宅组中,然后将它们分解到它们的小区域中,并分别为它们指定该住宅组在该小区域中的平均施工年份。例如,将小面积12345中的所有公寓分开,并分别(在新列中)指定该小面积公寓的平均建设年份
到目前为止,geo_住宅是一个带柱的GeoDataFrame
In [20]: geo_dwelling.head(5)
出[20]: cso_小_地区都柏林邮政编码建设年份建设年份范围住宅类型描述能源等级。。。高度集团高度集团楼层集团楼层集团类别住宅集团 7101 268109005都柏林1 2009.0 2005年起中层B3公寓。。。10.02 03 0 R公寓 7101 268109005都柏林1 2009.0 2005年起中层B3公寓。。。10.73 03 0 R公寓 7101 268109005都柏林1 2009.0 2005年起中层B3公寓。。。10.56 03 0 R公寓 7101 268109005都柏林1 2009.0 2005年起中层B3公寓。。。10.75 03 0 R公寓 7101 268109005都柏林1 2009.0 2005年起中层B3公寓。。。10.85 03 0 R公寓
geo_dwelling = geo_dropped[
geo_dropped["Dwelling Group"].str.contains("Apartment", na=False)]
geo_dwelling.groupby(["cso_small_area"])[["Year of construction"]].median()
非常感谢您的帮助
在熊猫数据帧中创建“for”循环通常被认为是不好的做法(也需要很多时间!)。我相信你的问题的答案就在这篇文章中:
How to iterate over rows in a DataFrame in Pandas
相关问题 更多 >
编程相关推荐