1.对于唯一位置,在数据集中迭代一次,以计算行驶公里数的平均值
2.对于相同的唯一位置,再次迭代数据集以计算行驶公里数的方差
3.对所有唯一位置重复此操作。迭代计算不同位置行驶公里数的均值和方差。测量所需的时间
4.停止计时。打印出每个位置行驶公里数的平均值和方差以及经过的时间
我的代码:
#1
for l in list(df.Location.unique()):
col_mean = 0.0
num_rows=0
for row in range(len(df)):
if df.loc[row, 'Location'] == l:
num_rows += 1
col_mean += df.loc[row, "Kilometers_Driven"]
col_mean = col_mean/num_rows
print( 'Location: %s mean %.2f' % (l, col_mean) )
#2Calculating variance of "Kilometers_Driven" manually. how to add unique?
col_var = 0.0
for row in range(len(df)):
col_var += (df.loc[row, "Kilometers_Driven"] - col_mean)**2
col_var /= len(df) - 1
print(col_var)
但是如何为第二个问题添加唯一的位置
试试这个
相关问题 更多 >
编程相关推荐