在文本挖掘中使用嵌套词典

1条回答

网友

1楼 · 发布于 2024-06-16 11:24:03

您可以使用trie对其进行评分，然后根据匹配键的长度对结果进行评分。你知道吗

首先使用后缀的反向字符串索引共轭：

In [1]: import pygtrie

In [2]: trie = pygtrie.CharTrie()

In [3]: trie['re'] = 'v0'

In [4]: trie['rec'] = 'v1'

然后可以使用以下代码查询共轭：

In [22]: list(trie.prefixes(''.join(reversed('aimer'))))
Out[22]: [('re', 'v0')]

In [23]: list(trie.prefixes(''.join(reversed('balancer'))))
Out[23]: [('re', 'v0'), ('rec', 'v1')]

然后您可以使用如下简单函数对结果进行评分：

In [24]: best = lambda candidates: sorted(candidates, key=lambda x: len(x[0]), reverse=True)[0]

In [25]: best(trie.prefixes(''.join(reversed('balancer'))))
Out[25]: ('rec', 'v1')

编程相关推荐

netbeans根据命名约定返回布尔类的getter的Java名称
java如何在MessageFormat中使用单引号
java如何在整数数组中只对奇数排序，而将偶数保留在其原始位置？
自定义ArrayAdapter中未定义java构造函数
java joda时间格式化程序解析yyyyymmdd（额外一小时）
java Spring引导控制器测试始终返回404
java如何提取类文件以获取该类文件中的类？
JTable java列不会显示
java Selenium Web驱动程序输出错误的Web表行数
当应用程序在mac上打开时，java SWT选项卡项会从页面上消失

相关问题更多 >

编程相关推荐

热门问题

热门文章

在文本挖掘中使用嵌套词典

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >