Python中文
首页
教程
问答
标签
搜索
登录
注册
Python Pandas通过匹配主标识符将来自多个数据帧的数据追加到同一行,如果该数据帧没有结果,则留空
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>对于python和pandas非常陌生,我只在尝试学习和自动化乏味的Excel任务时偶尔使用它。我遇到了一个问题,我不能通过Google或这里的Stack Overflow找到我要找的东西。在</p> <p>我目前有6个不同的excel(.xlsx)文件,我可以分析和读取到数据帧。但是,每当我尝试将它们追加到一起时,它们只是作为新行添加到最终输出的excel文件中,但是我尝试将相似的数据值追加到同一行,而不是同一列,这样我就可以看到这个唯一的值是否显示在这些数据集中。下面是一个简短的例子</p> <pre><code>[df1] 0 Col1 Col2 1 XYZ 41235 2 OAIS 15123 3 ABC 48938 [df2] 0 Col1 Col2 1 KFJ 21493 2 XYZ 43782 3 SHIZ 31299 4 ABC 33347 [Expected Output] 0 Col1 [df1] [df2] 1 XYZ 41235 43782 2 OAIS 15123 3 ABC 48938 33347 4 KFJ 21493 5 SHIZ 31299 </code></pre> <p>我尝试过使用合并,但是实际的数据表要复杂得多,因为我想在每个数据集中附加23列与每个唯一标识符相关联的数据。例如,[df2]中的[XYZ]在接下来的23列中有关联的信息,我想在[df1]中的[XYZ]值中的23列之后追加这些信息。在</p> <p>我该怎么做呢?每个excel表中大约有200行,我只需要在[df2]和[df1]中找到一个匹配的唯一标识符,然后用[df1]找到[df3],以此类推,直到[df6]为止,并将这些列附加到一个新的数据帧上,该数据帧最终将作为新的excel文件输出。在</p> ^{pr2}$ <p>是目前我将excel文件读入数据帧的方式,我确信我可以循环它,但是,我不确定这样做的最佳实践,而不是硬编码数据帧的每个初始化。在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您需要使用参数how='outer'合并</p> <pre><code>new_df = df1.merge(df2, on = 'Col1',how = 'outer', suffixes=('_df1', '_df2')) </code></pre> <p>你得到了</p> ^{pr2}$
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
jupyter运行一个旧的pytorch版本
3 回答
Jupyter运行不同版本的卸载库?
5 回答
Jupyter运行指定的键盘快捷键
10 回答
Jupyter通过.local文件“逃逸”virtualenv。我该如何缓解这种情况?
4 回答
Jupyter重新加载自定义样式
6 回答
Jupyter错误:“没有名为Jupyter_core.paths的模块”
9 回答
jupyter错误:无法在随机林中将决策树视为png
7 回答
Jupyter错误'内核似乎已经死亡,它将自动重新启动'为一个给定的代码块
8 回答
Jupyter错误地用阿拉伯语和字母数字元素显示Python列表
9 回答
Jupyter隐藏数据帧索引,但保留原始样式
9 回答
Jupyter集线器:启动器中出现致命错误。。。系统找不到指定的文件
7 回答
Jupyther中相同值的相同哈希,但导出到Bigquery时不相同
1 回答
Jupy上Python的读/写访问问题
7 回答
jupy上没有模块cv
1 回答
Jupy上的排序错误
9 回答
Jupy中bqplot图形的紧凑布局
10 回答
Jupy中matplotlib plot的连续更新
8 回答
Jupy中Numpy函数的文档
4 回答
Jupy中Pandas的自动完成问题
3 回答
jupy中Qt后端的Matplotlib动画
9 回答