Python中文
首页
教程
问答
标签
搜索
登录
注册
Python Pandas通过匹配主标识符将来自多个数据帧的数据追加到同一行,如果该数据帧没有结果,则留空
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>对于python和pandas非常陌生,我只在尝试学习和自动化乏味的Excel任务时偶尔使用它。我遇到了一个问题,我不能通过Google或这里的Stack Overflow找到我要找的东西。在</p> <p>我目前有6个不同的excel(.xlsx)文件,我可以分析和读取到数据帧。但是,每当我尝试将它们追加到一起时,它们只是作为新行添加到最终输出的excel文件中,但是我尝试将相似的数据值追加到同一行,而不是同一列,这样我就可以看到这个唯一的值是否显示在这些数据集中。下面是一个简短的例子</p> <pre><code>[df1] 0 Col1 Col2 1 XYZ 41235 2 OAIS 15123 3 ABC 48938 [df2] 0 Col1 Col2 1 KFJ 21493 2 XYZ 43782 3 SHIZ 31299 4 ABC 33347 [Expected Output] 0 Col1 [df1] [df2] 1 XYZ 41235 43782 2 OAIS 15123 3 ABC 48938 33347 4 KFJ 21493 5 SHIZ 31299 </code></pre> <p>我尝试过使用合并,但是实际的数据表要复杂得多,因为我想在每个数据集中附加23列与每个唯一标识符相关联的数据。例如,[df2]中的[XYZ]在接下来的23列中有关联的信息,我想在[df1]中的[XYZ]值中的23列之后追加这些信息。在</p> <p>我该怎么做呢?每个excel表中大约有200行,我只需要在[df2]和[df1]中找到一个匹配的唯一标识符,然后用[df1]找到[df3],以此类推,直到[df6]为止,并将这些列附加到一个新的数据帧上,该数据帧最终将作为新的excel文件输出。在</p> ^{pr2}$ <p>是目前我将excel文件读入数据帧的方式,我确信我可以循环它,但是,我不确定这样做的最佳实践,而不是硬编码数据帧的每个初始化。在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您需要使用参数how='outer'合并</p> <pre><code>new_df = df1.merge(df2, on = 'Col1',how = 'outer', suffixes=('_df1', '_df2')) </code></pre> <p>你得到了</p> ^{pr2}$
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
为什么我的神经网络模型的准确性不能在这个训练集上得到提高?
5 回答
为什么我的神经网络模型的权重变化不大?
2 回答
为什么我的神经网络的成本不断增加?
4 回答
为什么我的神经网络的输入pickle文件是19GB?
5 回答
为什么我的神经网络给属性错误?“非类型”对象没有属性“形状”
6 回答
为什么我的神经网络训练这么慢?
1 回答
为什么我的神经网络输出错误?
6 回答
为什么我的神经网络预测适用于MNIST手绘图像时是正确的,而适用于我自己的手绘图像时是不正确的?
4 回答
为什么我的神经网络验证精度比我的训练精度高,而且它们都是常数?
6 回答
为什么我的私人用户间聊天会显示在其他用户的聊天档案中?
2 回答
为什么我的积分的绝对误差估计值大于积分(使用scipy.integrate.nqad)?
3 回答
为什么我的积层回归器得分比它的组件差?
4 回答
为什么我的移动方法不起作用?
10 回答
为什么我的稀疏张量不能转换成张量
5 回答
为什么我的稀疏张量不能转换成张量?
5 回答
为什么我的程序“停止”了?
7 回答
为什么我的程序一直试图占用所有可用的CPU
5 回答
为什么我的程序不使用指定的代理
6 回答
为什么我的程序不工作(python帮助中的反向函数)?
3 回答
为什么我的程序不工作时,我使用多处理模块
3 回答