我有一个非常大的数据集。我一直在使用SAS;但是我对使用Python和excel持开放态度(只有excel有很好的细节——我从未在这里编程)。每一个人都有一个识别号,他按时间顺序逐行进行观察。在某些行中,我有一个二进制观察值,分别用1或0表示“成功”或“失败”。我想再添加三列(在包含成功/失败的每一行上),其中包含成功的总数(当它们累积时)和失败的总数(当它们累积时)以及两者之间的比率。这个比例很小;但是,我只是不知道如何做到前两个。任何帮助都将不胜感激。谢谢!你知道吗
作为更新:这里是我的数据集的一个想法:
ID Success Failure totaSuccess totalFailure ratio
1234 - - - - -
1234 1 0 1 0 1/(1+0)
2345 - - - - -
2345 0 1 0 1 0/(1+0)
1234 0 1 1 1 1/(1+1)
在SAS中,您可以创建一个视图,以便它随着表的更新而更新。不管您使用什么解决方案,重要的是要弄清楚您的表是如何更新的。你知道吗
相关问题 更多 >
编程相关推荐