请手动计算差异

2024-04-19 08:43:09 发布

您现在位置:Python中文网/ 问答频道 /正文

1.对于唯一位置,在数据集中迭代一次,以计算行驶公里数的平均值

2.对于相同的唯一位置,再次迭代数据集以计算行驶公里数的方差

3.对所有唯一位置重复此操作。迭代计算不同位置行驶公里数的均值和方差。测量所需的时间

4.停止计时。打印出每个位置行驶公里数的平均值和方差以及经过的时间

我的代码:

#1
for l in list(df.Location.unique()): 
    col_mean = 0.0

    num_rows=0
    for row in range(len(df)):
        if df.loc[row, 'Location'] == l:
              num_rows += 1
              col_mean += df.loc[row, "Kilometers_Driven"]
    col_mean = col_mean/num_rows

    print( 'Location: %s mean %.2f' % (l, col_mean) )

#2Calculating variance of "Kilometers_Driven" manually. how to add unique?

col_var = 0.0
for row in range(len(df)):
    col_var += (df.loc[row, "Kilometers_Driven"] - col_mean)**2
col_var /= len(df) - 1 
print(col_var)

但是如何为第二个问题添加唯一的位置


Tags: indfforlenvarcollocationmean
1条回答
网友
1楼 · 发布于 2024-04-19 08:43:09

试试这个

import pandas as pd    
data = pd.read_csv('train-data.csv', header=0) 
data.groupby('Location')['Kilometers_Driven'].mean() 
data.groupby('Location')['Kilometers_Driven'].var() 

相关问题 更多 >