我在某个NLP工作。我比较了一组文章和输入词。主要目标是在发现一堆单词时对文本进行分类
我尝试提取字典中的值并将其转换为列表,然后对其应用词干分析。问题是,稍后我将执行另一个进程,根据键进行拆分和比较。我想如果更实际的话就直接在字典里工作。你知道吗
search = {'Tecnology' : ['computer', 'digital', 'sistem'], 'Economy' : ['bank', 'money']}
words_list = list()
for key in search.keys():
words_list.append(search[key])
search_values = [val for sublist in words_list for val in sublist]
search_values_stem = [stemmer.stem(word) for word in test]
我希望词典的词干与文章的词干直接比较
如果我正确理解了您的问题,那么您希望对字典的值(而不是键)应用词干分析,此外,字典中的值都是字符串列表。你知道吗
下面的代码应该这样做:
相关问题 更多 >
编程相关推荐