擅长:python、mysql、java
<p>这个问题没有简单的解决办法。你知道吗</p>
<p>我能想到的唯一解决办法是用字典检查一个词是否正确(英文字典里有)。你知道吗</p>
<p>但即使这样你也会得到很多假阳性。例如,如果我得到文本:</p>
<blockquote>
<p>a n a n a s</p>
</blockquote>
<p>文字:</p>
<ul>
<li>a</li>
<li>安</li>
<li>作为</li>
</ul>
<p>在英语词典里都是正确的。如何拆分文本?对我来说,作为一个能读课文的人,这里的词显然是ananas。但我们可以这样分割文本:</p>
<blockquote>
<p>an an as</p>
</blockquote>
<p>这在语法上是正确的,但在英语中没有意义。正确性由上下文给出。一、 作为人类,我能理解上下文。人们可以用不同的方法拆分、合并字符串,以检查它是否有意义。但不幸的是,没有库或简单的过程可以理解上下文。你知道吗</p>
<p>机器学习可能是一种方法,但没有完美的解决方案。你知道吗</p>