链接pandas数据帧的行

pandas-linker的Python项目详细描述


#pandas linker在pandas数据帧的不同排序上运行比较窗口,并通过指定的uuid链接行。此库实际上不执行任何重复检测。相反,它提供了在数据上运行自己的比较函数的工具。

相反,您可以决定数据帧的排序顺序,并且只能在滑动窗口中比较每一行和每一行之间的数据帧排序顺序,而只能在滑动窗口中比较每一行。


0皮特|西班牙
1玛丽美国
2巴特美国
3玛丽美国


方法如下:

``python
from pandas链接器import get链接器



def比较行(a,b):
''决定两行是否表示同一实体的示例函数。''
df是pandas.dataframe,具有唯一索引

field='uid')作为链接器:

cmp=compare_row)


`````













[ix]姓名国家uid
——————————————————
0彼得西班牙;7509781940fc471Cad5dc471Cad5dc32944646525d5dc5251515194464652D575751941414141414141414141414141414141414141414141414141414141414141414141414D6C
美国|12b55fbe80f64d378193acd727b0e051
3 mary us 8f8dccd91568472daf740e9160349d6c

请注意,数据帧中的两个“mary”行都被标识为表示同一实体,并且被分配了相同的uuid。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java OnResizeListener或OnDrawListener或类似的东西   java Orika映射嵌套子列表   保存时java Heroku请求超时代码H12   数据库在Java中出现socket读取超时异常的原因是什么?   java如何更改来自Sqlite数据库的特定数据在Listview中的行颜色   java JAXB解组器无法正确处理XML中的列表   java Android日期时区让我抓狂   java不透明属性在Swing中如何工作?   eclipse从JavaEE代码生成流程图   java如何在Hibernate中从相关表中获取计数   java Glassfish部署了项目的依赖项库   java使内容适合JavaFx中的WebView   java不满意的链接错误libcrypto。所以1.0.0   循环中java数组的使用   java找出哪个包调用服务