我正在研究一个有超过一百万个游戏的象棋数据库。我有兴趣找出不同球员的一些特点。我的问题是,每一个球员出现与几个标识。你知道吗
例如
"Carlsen, M."
、"Carlsen, Ma"
、"Carlsen, Magnus"
和"Magnus Carlsen"
都对应于播放器"Magnus Carlsen"
。你知道吗
此外,还有其他玩家与卡尔森姓相同,但名字不同,例如"Carlsen, Ingrid Oen"
和"Carlsen, Jesper"
。你知道吗
我需要确定数据库中所有不同的名字,对应于每个特定的球员,并结合他们。用Python有什么方法可以做到这一点吗?你知道吗
你知道吗@伊夫·库尼斯解决方法简单有效,我自己也用得很成功。大多数时候,我们只关心顶尖棋手。我就是这么做的:
你可以试试正则表达式,但没必要。玩家的名字有一个简单的模式:
这适用于数据库中的其他玩家。保存正则表达式直到您真的必须这样做。你知道吗
相关问题 更多 >
编程相关推荐