joined_Gravity1.head()
Comments
____________________________________________________
0 Why the old Pike/Lyrik?
1 This is good
2 So clean
3 Looks like a Decoy
Input: type(joined_Gravity1)
Output: pandas.core.frame.DataFrame
下面的代码允许我选择包含关键字的字符串:“ender”
joined_Gravity1[joined_Gravity1["Comments"].str.contains("ender", na=False)]
输出:
Comments
___________________________
194 We need a new Sender 😂
7 What about the sender
179 what about the sender?😏
如何修改代码以包含类似于“发件人”的单词,如“snder”、“bnder”
我看不出
regex=True
函数中的contains
在这里不起作用的原因我只使用了
"ender|snder|bnder"
。您可以列出所有这些单词,比如list_words
,并在上面的contains
函数中传入pat='|'.join(list_words)
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.str.contains.html
这类单词中的字母组合可能会出现大量的可能性。您试图做的是两个字符串之间的模糊匹配。我建议使用以下方法:
基于此,您可以决定选择哪个阈值,然后将高于阈值的阈值标记为匹配(使用上面使用的代码)
这里有一个方法可以在你的问题陈述中用一个函数做到这一点-
t如果想要更精确的匹配,请将t值从70调整到80;如果想要更轻松的匹配,请将t值从70调整到80
最后你可以过滤掉-
相关问题 更多 >
编程相关推荐