数据科学模型推荐

**CustomerName - CardType - BankName - Country** 1) Tony - VISA - CITI - USA 2) Anthony - VISA - BOFA - USA 3) Anthony - MC - BOFA - USA 4) Anthony - VISA - CITI - USA 5) Anthony - MC - BOFA - USA 6) Jess - VISA - AMEX - USA 7) Jess - VISA - BOFA - USA 8) Jess - VISA - AMEX - USA

2条回答

网友

1楼 · 编辑于 2024-04-25 22:18:33

我不确定这是否对你有帮助。但是你能使用任何一个全局字典为每一行存储一个值吗？你知道吗

例如，您有这样一个规则“So as DataSet rule:每个客户只能拥有一个国家/地区内一家银行的一张卡”，并考虑这一行“Tony-VISA-CITI-USA”。通过连接规则所需的该行的列的所有值来创建字符串“TonyCITIUSA”。你知道吗

s = "TonyCITIUSA" globalDict = {}

现在检查字符串是否存在于全局字典中，如果存在，则表示如果字典中不存在字符串，则该行是一个规则破坏者。然后将字符串添加到字典中以备将来使用。你知道吗

if s in globalDict: //Rule breaker found else: globalDict.add(s)

如果这样行的话，请告诉我！你知道吗

网友

2楼 · 编辑于 2024-04-25 22:18:33

我想你需要df.drop_duplicates(subset=['column_names',..]) 检查docs。这也许对你有帮助。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章