Python中文
首页
教程
问答
标签
搜索
登录
注册
如何在合并Pandas中的两个数据帧时“模糊”匹配字符串
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有两个数据帧<code>df1</code>和<code>df2</code></p> <pre><code>df1 = pd.DataFrame ({'Name': ['Adam Smith', 'Anne Kim', 'John Weber', 'Ian Ford'], 'Age': [43, 21, 55, 24]}) df2 = pd.DataFrame ({'Name': ['adam Smith', 'Annie Kim', 'John Weber', 'Ian Ford'], 'gender': ['M', 'F', 'M', 'M']}) </code></pre> <p>我需要使用列<code>Name</code>上的pandas.merge连接这两个数据帧。但是,正如您所注意到的,两个数据帧的<code>Name</code>列之间有一些细微的差异。让我们假设他们是同一个人。如果我只是这样做:</p> <pre><code>pd.merge(df1, df2, how='inner', on='Name') </code></pre> <p>我只得到了一个只有一行的数据帧,那就是‘伊恩·福特’</p> <p>有人知道如何合并这两个数据帧吗?如果我们在一个字符串列上连接两个表,我想这是非常常见的情况。我完全不知道如何处理这件事。先谢谢你</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>不确定模糊匹配是否是您要寻找的。也许每个名字都是一个合适的名字</p> <pre><code>df1.Name = df1.Name.apply(lambda x: x.title()) df2.Name = df2.Name.apply(lambda x: x.title()) pd.merge(df1, df2, how='inner', on='Name') </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何提高Djang的410误差
10 回答
如何提高doc2vec模型中两个文档(句子)的余弦相似度?
7 回答
如何提高Docker的日志限制?|[输出已剪裁,达到日志限制100KiB/s]
9 回答
如何提高DQN的性能?
9 回答
如何提高EasyOCR的准确性/预测?
6 回答
如何提高Euler#39项目解决方案的效率?
6 回答
如何提高F1成绩进行分类
4 回答
如何提高FaceNet的准确性
6 回答
如何提高fft处理的精度?
3 回答
如何提高Fibonacci实现对大n的精度?
2 回答
如何提高Flask与psycopg2的连接时间
3 回答
如何提高FosterCauer变换的scipy.signal.invres()的数值稳定性?
4 回答
如何提高gae查询的性能?
8 回答
如何提高GANs用于时间序列预测/异常检测的结果
1 回答
如何提高gevent和tornado组合的性能?
3 回答
如何提高googleappengin请求日志的吞吐量
7 回答
如何提高googlevision文本识别的准确性
8 回答
如何提高groupby/apply效率
2 回答
如何提高Gunicorn中的请求率
4 回答
如何提高G中的文件编码转换
4 回答