如何从大Pandas的字典中为特定单词列表创建前5个接近单词的数据框

2024-04-24 04:46:20 发布

您现在位置：Python中文网/ 问答频道 /正文

4875

网友

男 | 程序猿一只，喜欢编程写python代码。

我有一本word2vec字典，它给出了一个与给定单词最相似的单词。你知道吗

我想传递需要从文件或列表中计算相似度的单词列表

输入

word_list =['wan,'floor','street']

应根据word2vec字典检查这些单词的相似性，必须找到与输入单词列表相似的单词，并以下面显示的格式写入数据帧。你知道吗

model.most_similar("wan")

[('wan.', 0.7509685754776001),
 ('want', 0.7326164245605469),
 ('aupuiwan', 0.7161564230918884),
 ('puiwan', 0.7119397521018982),
 ('wanstreet', 0.7096157073974609),
 ('woshing', 0.7046518921852112),
 ('futan', 0.6979573369026184),
 ('won', 0.696295440196991),
 ('fota', 0.6961145401000977),
 ('pul', 0.6921802759170532)]

我想创建一个包含两列Word和类似单词的dataframe。你知道吗

输出数据帧

Word    Similar Words
wan     ('wan.', 'want','aupuiwan','puiwan','wanstreet')
floor   ('fl','flooor','flor','flr','gf')
street  ('st','rosestreet','stret','strt','str')

感谢您的帮助。你知道吗

Tags：数据 street 列表字典 word2vec 单词 list word

1条回答

网友
1楼 · 发布于 2024-04-24 04:46:20

试试这个：
words = ['wan', 'floor', 'street'] similar = [[item[0] for item in model.most_similar(word)[:5]] for word in words] df = pd.DataFrame({'Word': words, 'Similar Words': similar})

如何从大Pandas的字典中为特定单词列表创建前5个接近单词的数据框

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何从大Pandas的字典中为特定单词列表创建前5个接近单词的数据框

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >