基于前一行中的值提取数据

2024-06-09 08:08:06 发布

您现在位置:Python中文网/ 问答频道 /正文

我收到一个Excel文件,其中包含约6万行数据,其中包含有关用户与文本消息应用程序交互的信息。一个简单的数据示例如下所示: Example of Data

我需要根据对前一行中针对每个唯一用户ID提出的问题的回答提取信息。例如,如果有一条传出消息:“多少天前你开始感到不舒服?如果传入的消息是“3”,我想为每个用户ID创建一个变量“Sick\u Start\u Date”,表示他们生病了,并从他们回答问题的日期中减去3。在上面的例子中,是7/11/2017。 我可以用Excel中的一些公式暴力来做到这一点,但我想可能有一种更好的更“QA-able”的方法来分析以这种方式构建的数据。 需要考虑的其他复杂性:

  • 如果用户在毫秒内响应消息,则数据文件 通常无法正确处理订单–它可能会记录两个传出的订单 消息,然后是传入消息,尽管 传入消息出现在两条传出消息之间

  • 用户并不总是响应,会发送多条传出消息


Tags: 文件数据用户订单文本信息id应用程序