如何在python中查找和删除无效/无意义的文本？

1条回答

网友

1楼 · 发布于 2024-05-16 21:32:31

您可以将值与某些命令进行比较，这里是从ntlk开始的，如果不匹配，则删除值，但如果字典ntlk中不存在，则仍可能删除某些值，如mom：

import nltk
words = set(nltk.corpus.words.words())

#https://stackoverflow.com/a/41290205
f = lambda x: " ".join(w for w in nltk.wordpunct_tokenize(x) if w.lower() in words)

#apply only for object columns (obviously strings)
cols = df.select_dtypes(object).columns
df[cols] = df[cols].applymap(f)
print (df)
   ID          A1   B1      C1
0   1       apple       banana
1   2  I love you             
2   3              dad

编程相关推荐

java访问私有字段而不使用getter方法？
使用PowerMockito在JavaEWSAPI中模拟测试拉订阅
启动活动时未保存java首选项并清除变量
java如何在servlet中检索子域？斯普林有帮手吗
java使用Docker从命令行构建Android项目
java Android，ActionBar后退按钮（setDisplayHomeAsUpEnabled（true））重新创建父活动
java在重用FileOutputStream时应该关闭流吗？
java使用RESTAPI将文件上载到s3 bucket
Java SOAP Web服务应用程序中的mysql用户登录方法不工作
java使用多个数字计算百分比并转换为长

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在python中查找和删除无效/无意义的文本？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >