我在stackoverflow中找不到基于字典替换的解决方案,其中值位于列表中。你知道吗
字典
dct = {"LOL": ["laught out loud", "laught-out loud"],
"TLDR": ["too long didn't read", "too long; did not read"],
"application": ["app"]}
输入
input_df = pd.DataFrame([("haha too long didn't read and laught out loud :D"),
("laught-out loud so I couldnt too long; did not read"),
("what happened?")], columns=['text'])
预期产量
output_df = pd.DataFrame([("haha TLDR and LOL :D"),
("LOL so I couldnt TLDR"),
("what happened?")], columns=['text'])
编辑
在字典中添加了一个附加条目,即“application”:[“app”]
当前的解决方案给出的结果是“发生了什么?”你知道吗
请建议一个解决方案。你知道吗
下面是我将要做的:
构建一个反向映射并将
Series.replace
与regex=True
一起使用。你知道吗在哪里
要匹配完整单词,请为每个单词添加单词边界:
在哪里
使用
df.apply
和自定义函数例如:
输出:
或者
相关问题 更多 >
编程相关推荐