Python dfply包连接

2024-04-30 02:17:36 发布

您现在位置:Python中文网/ 问答频道 /正文

来自R并尝试用Python中的dfply包模拟dplyr。需要帮助。在

我有两个问题,请帮忙。在

  1. 如果这些连接列有不同的名称,我如何连接两个数据集?在
  2. 有没有办法让我加入更多的专栏?根据文件,我只能加入一个专栏。在

https://github.com/kieferk/dfply#joining

我喜欢dfply包,但它缺少关键功能。谢谢你的帮助。或者帮助我使用Python中的其他包,比如rdplyr


Tags: 文件数据https功能github名称com关键
1条回答
网友
1楼 · 发布于 2024-04-30 02:17:36

dfply包是基于python中的大熊猫包构建的。它的文档主要用于指导您了解其基本功能。如果你去它的github回购找到join.py文件,您可以看到各种连接所依赖的底层实现数据框合并熊猫的功能。在

因此,回答您的问题(希望不会太晚):

  1. 如果这些连接列有不同的名称,我如何连接两个数据集?在

    df>> inner_join(other, by=('A_c1','B_c1'))
    
  2. 有没有办法让我加入更多的专栏?根据文件,我只能加入一个专栏。在

    df>> inner_join(other, by=[('A_c1','B_c1'),('A_c2','B_c2')])
    

我需要补充的一点是,在撰写本文时,即2018年10月,您必须安装该包的开发版本,该版本添加了多列联接功能。在

相关问题 更多 >