def bool_to_int(list):
num = 0
for k, v in enumerate(list):
if v==1:
num+=(2**k)
return num
def take_action(code):
if code==1:
# do this
elif code==2:
# do this
...
keywords = ['display', 'phone', .....,]
list_of_words = data.split(" ")
code = [0]*len(keywords)
for i in list_of_words:
if i in keywords:
idx = keywords.index(i)
code[idx]=1
code = bool_to_int(code)
take_action(code)
如果您不想使用任何外部库,下面是一个简单的方法
使用NLTK库,导入stopwords。 写一段代码,如果你的文本中的单词是stopword,那么你必须删除这个单词。您将得到过滤后的输出
还有, 制作一个负面列表文件-包含除要删除的停止字以外的所有字,在上面的代码之前用这些字扩展停止字,这样您将得到100%正确的输出
相关问题 更多 >
编程相关推荐