我有一个CSV文件(未规范化,例如,实际文件最多100列):
ID, CUST_NAME, CLIENT_NAME, PAYMENT_NUM, START_DATE, END_DATE
1, CUST1, CLIENT1, 10, 2018-04-01, 2018-04-02
2, CUST1, CLIENT1, 10, 2018-04-01, 2018-05-30
3, CUST1, CLIENT1, 101, 2018-04-02, 2018-04-03
4, CUST2, CLIENT1, 102, 2018-04-02, 2018-04-03
如何找到可以用作主键的所有可能的列集合。在
期望输出:
^{pr2}$我可以用Java实现,但Python/Pandas可能已经提供了一个快速的解决方案
这是通过
itertools.combinations
的一种方式。它的工作原理是,对于每一组列,删除重复项并检查数据帧的大小是否发生变化。在这导致44个不同的列组合。在
熊猫和itertools会给你你想要的。在
这将为您提供以下输出:
^{pr2}$相关问题 更多 >
编程相关推荐