擅长:python、mysql、java
<p>这是一个困难的问题,取决于本例中没有哪些数据以及需要的输出。实体值中是否有重复数据?秩序重要吗?你想在输出中重复吗?你知道吗</p>
<p>可以使用以下几种工具:</p>
<ul>
<li><a href="https://stackoverflow.com/questions/11015320/how-to-create-a-trie-in-python">make a trie</a>在您搜索字符串之前,先从实体值中取出。如果您有相同名称的重叠版本,如“Netgear”和“Netgear INC.”,并且您想要最长的版本,那么这是很好的。你知道吗</li>
<li><a href="https://pythonprogramming.net/chunking-nltk-tutorial/" rel="nofollow noreferrer">nltk.PunktSentenceTokenizer</a>这个词对名词很难理解。本教程在解释如何处理它们方面做得更好。你知道吗</li>
</ul>