这是我的第一个问题。我想建立一个统计模型。我有一个数据框,我想在这个数据框中添加一列。我想让这个专栏展示一些统计数据。 例如,我的数据帧是这样的
例如,我想添加一个新列。我想让这个专栏显示“车红女孩”的D值大于所有车的D值的平均值。我应该怎么做?我应该用哪种方法来建立这个统计模型。我有大量数据,无法手动计算所有汽车或自行车的平均值。我需要一个带有if-else语句的函数,并添加一列来描述行的D大于或小于平均值
我的代码是这样的,但我得到了关键错误0
for b in list(df.A.unique()):
for i in range(len(df.loc[df.A == b])):
if df.loc[df.A == b, "D"][i] >= df.loc[df.A == b,"D"].mean():
df.loc[df.A== b]["E"][i] = "Bigger"
这可以通过使用
pandas
库来实现。假设DataFrame
存储在变量df
中步骤1-计算列的平均值
步骤2-获取列值大于列平均值的索引
步骤3-将这些索引中的值设置为True
编辑1
把每个词的意思储存在字典里
计算值大于平均值的相应指数(单独计算)
将索引设置为
True
输出
Output DataFrame
Output Dictionary with Corresponding Mean
相关问题 更多 >
编程相关推荐