方差分析

2024-04-30 03:07:34 发布

您现在位置:Python中文网/ 问答频道 /正文

我希望我能说得尽可能清楚。 我有一个包含400个研究对象的excel文件,每一个都有他们的年龄、性别和40多列生物变量。 Es:CODE0001;(年龄)20岁;M\F;生物价值1;生物价值2。。。。。生物价值40

我的目标是用单因素方差分析来分析这些数据,因为我认为这是我最好的选择。我正在尝试这样做(甚至使用这个指南https://www.marsja.se/four-ways-to-conduct-one-way-anovas-using-python/),但是代码总是有问题

那么:我如何设置我的数据以便能够使用该网站的代码

我已经对所有数据执行了Dataset.mean()和Dataset.std(),但我不能使用例如值“mean Age”,因为Jupyter似乎只将其读取为字符串而不是值

我正处于一种深深的困惑之中,所以所有的帮助都将被超级感激

先谢谢你


Tags: 文件数据对象代码目标es生物mean
2条回答

使用df.mean()df.std()时,请尝试先将数据更改为pd.Series并运行它

对不起,我不明白。我对python比较陌生,所以可能无法正确地解释自己。 我需要进行方差分析:

首先,我这样做:

AnalisiISAD.mean()

2)然后我列出了一个清单:

平均值=[……] 3) 然后,我继续进行方差分析脚本

AnalisiI.boxplot('MeanList', by='AgeT0', figsize=(12,8))

ctrl = Analisi['MeanList'][Analisi == 'ctrl']

grps = pd.unique(Analisi.group.values)

d_data = {grp:Analisi['MeanList'][Analisi.group ==grp] for grp in grps}

k = len(pd.unique(Analisi.group))

N = len(Analisi.values)

n = Analisi.groupby('AgeT0').size()[0]

但是出现了这个错误:KeyError: 'Column not found: MeanList'

这是否意味着我必须在excel文件中创建一个新列?我该怎么做

相关问题 更多 >