我们得到许多excel文件,其中包含如下数据集(图1):
在该数据中,第一组数据属于2019年的账号12314234
,第二组数据属于2018年的账号2345345
。此类数据的主要问题是捕获这些账号和日期,并将其数据与记录对齐。
我们通常将这些excel文件加载到ACL中,并对其使用静态功能,使其如下所示:
id first_name last_name Account Year
1 Vin Gotecliffe 12314234 2019
2 Ike Groom 12314234 2019
3 Bren Knipe 12314234 2019
4 Hermy Purry 12314234 2019
5 Ilysa Knutton 12314234 2019
1 Vin Gotecliffe 2345345 2018
2 Ike Groom 2345345 2018
3 Bren Knipe 2345345 2018
4 Hermy Purry 2345345 2018
5 Ilysa Knutton 2345345 2018
如果您注意到账号和日期字段数据已被捕获并在列中对齐。在上述数据中,帐号和日期字段值已与其所属的数据集对齐
我正在寻找一个python代码(由于限制,无法使用任何其他语言),它可以解决这个问题,因为如果需要,我们可以将这些excel文件转换为以制表符分隔的文件
注意:请不要将问题搁置。请通知我,如果需要进一步的描述,我将投入更多的努力,以明确。这个问题很难描述,可能不是每个人都清楚
目前没有回答
相关问题 更多 >
编程相关推荐