如何找出英语单词是否存在于字符串中

2024-04-25 04:11:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试解析一些web域(数以万计),看看它们是否包含任何英语单词。你知道吗

对我来说,用tldextract解析域以获取域的主要部分很容易,然后我尝试使用enchant来查看它们是否存在于英语词典中。你知道吗

问题是我不知道如何将域拆分为多个字来检查,即latimes返回False,而times返回True。你知道吗

有没有人知道一个聪明的方法来检查字符串中是否包含一个英语单词?你知道吗

谢谢!你知道吗


Tags: 方法字符串webfalsetrueenchant英语词典latimes
1条回答
网友
1楼 · 发布于 2024-04-25 04:11:41

除非你急着这么做,你可以从字符串的开头或结尾剪下字母,检查它是否是已知的单词;如果是,就把它剪下来重复。例如,5万个单词,每个单词20个字母,最坏的情况下,你要查找1百万个单词。如果查找需要5毫秒(每次点击一个硬盘),则需要5000秒(约1.5小时),比你想出更好的算法要短。你知道吗

相关问题 更多 >