Python中文
首页
教程
问答
标签
搜索
登录
注册
Python:检查关键字是否在字符串中拆分
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有两个数据帧-一个包含自由流动的文本描述,另一个是主字典。我试图检查主词典中的单词是否以任何格式出现在文本描述中-例如,如果主关键字是<em><strong>123456789</strong></em>,它可以作为<em><strong>123456789</strong></em>或<em><strong>123456789</strong></em>出现在用户文本中。关键字既可以是数字,也可以是字母数字</p> <p>我曾尝试删除文本描述中的空格,并在</em>函数中使用<em>进行检查,但这种方法也匹配噪音。例如,它也将匹配B123456789KLX</em>。我只想在整个关键字被分割并作为多个单词给出,而不是在不同的单词之间进行匹配</p> <p>我现在有:</p> <pre><code>def matcher(x,word_dict): match="" for i in list(dict.fromkeys(word_dict)): if i.replace(" ", "").lower() in x.replace(" ", "").lower(): if(match==""): match=i else: match=match+"_"+i return match import pandas as pd df = pd.DataFrame({'ID' : ['1', '2', '3', '4','5'], 'Text' : ['sample 123 45 678 text','sample as123456 text','sample As123 456','sample bas123456 text','sample bas123 456ts text']}, columns = ['ID','Text']) master_dict= pd.DataFrame({'Keyword' : ['12345678','as123456']}, columns = ['Keyword']) df['Match']=df['Text'].apply(lambda x: matcher(x,master_dict.Keyword)) Expected Output ID Text Match 0 1 sample 123 45 678 text 12345678 1 2 sample as123456 text as123456 2 3 sample As123 456 as123456 3 4 sample bas123456 text NA 4 5 sample bas123 456ts text NA </code></pre> <p>任何线索都会有帮助。提前谢谢</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>如果该字符串是另一个字符串的一部分,则使用in函数进行检查将得到true,我认为使用:</p> <pre><code>if string == keyword: </code></pre> <p>在处理空格后,将产生您想要的结果,因此如果结果与关键字不完全相等,则应返回False</p> <p>让我知道我是否正确理解了你的要求,以及它是否有帮助</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何找到类似于How'matplotlib.pyplot.gcf()`works?
8 回答
如何找到类字段的定义?
5 回答
如何找到精灵在团队中的位置?
6 回答
如何找到素数,但有错误。我找不到你
10 回答
如何找到素数(Python)
8 回答
如何找到索引i右侧的不同值
8 回答
如何找到索引Numpy数组时将折叠哪些轴?
8 回答
如何找到索引中的值,在列表中增加值?
3 回答
如何找到纬度/经度/高度点之间的三维距离?
10 回答
如何找到线和numpy meshgrid生成的曲面之间的交点?
7 回答
如何找到线段上距任意点最近的点?
7 回答
如何找到组中所有可能的子组
2 回答
如何找到组内值之间的最小差异
2 回答
如何找到经过训练的朴素贝叶斯分类器用于决策的单词?
8 回答
如何找到给selenium webdriver对象的文件夹名?
1 回答
如何找到给出最佳分数的列车测试分割的最佳随机状态值?
7 回答
如何找到给定Python发行版提供的模块?
6 回答
如何找到给定subversion工作副本的根文件夹
4 回答
如何找到给定一维阵列中的所有峰值?
3 回答
如何找到给定列表中的字符串组合,这些字符串加起来就是某个字符串(没有外部库)
1 回答