如何将词干应用到词典中?

2024-04-20 03:42:01 发布

您现在位置:Python中文网/ 问答频道 /正文

我在某个NLP工作。我比较了一组文章和输入词。主要目标是在发现一堆单词时对文本进行分类

我尝试提取字典中的值并将其转换为列表,然后对其应用词干分析。问题是,稍后我将执行另一个进程,根据键进行拆分和比较。我想如果更实际的话就直接在字典里工作。你知道吗

search = {'Tecnology' : ['computer', 'digital', 'sistem'], 'Economy' : ['bank', 'money']}
words_list = list()
for key in search.keys():
    words_list.append(search[key])
search_values = [val for sublist in words_list for val in sublist]
search_values_stem = [stemmer.stem(word) for word in test]

我希望词典的词干与文章的词干直接比较


Tags: keyinforsearch字典nlp文章val
1条回答
网友
1楼 · 发布于 2024-04-20 03:42:01

如果我正确理解了您的问题,那么您希望对字典的值(而不是键)应用词干分析,此外,字典中的值都是字符串列表。你知道吗

下面的代码应该这样做:

def stemList(l):
    return([stemmer.stem(word) for word in l])

# your initial dictionary is called search (as in your example code)
#the following creates a new dictionary where stemming has been applied to the values

stemmedSearch = {}
for key in search:
    stemmedSearch[key] = stemList(search[key])

相关问题 更多 >