我是一名外科医生,正在尝试分析一些患者数据。我有一个患者数据框(271x15),这些患者进行了多次手术。这是来自单个操作的更大(4010x71)数据帧,使用@Arne的大量帮助。基本上(见下文) original post)使用透视表,然后查找多个(>;=2)操作。这太棒了。我感兴趣的是前两次手术以及两次手术之间的天数,以确定植入手术的持续时间。 数据框头部位于此处,显示植入物插入和移除的患者ID和代码(V011和V014)
OPERTN_01 OPDATE_01
ID
11 [V011, V014] [2016-06-21, 2017-02-27]
13 [V011, V014] [2016-07-14, 2016-01-14]
14 [V014, V011] [2014-02-25, 2014-07-01]
15 [V014, V011] [2014-06-26, 2015-04-16]
我希望把两次手术的日期减去
pd.datetime
我一直在拆支架。我尝试过替换df.replace("[", "")
,这对数据帧或序列OPERTN_01
没有影响。理想情况下,我希望在整个数据帧中删除方括号,而不是逐列删除
在这个数据框架中产生的列表(感谢@Arne)产生了非常好的描述性统计数据,但对我来说很难操作
我还有一个问题,OPDATE_01中的日期没有排序,因此日期之间的差异通常为负数。可能是因为我想在一个时间做的太多了
你在找这样的东西吗:
或
根据你的评论
v011v014
v014v011
相关问题 更多 >
编程相关推荐