擅长:python、mysql、java
<p>如果将文本文件保存为平面文本文件(纯文本),而不是RTF,那么代码就可以正常工作。你知道吗</p>
<p>RTF文件包含用于文本布局和格式的额外数据,这会导致代码在读取每一行时获取额外的元数据。你知道吗</p>
<p>有一些库支持RTF文件的文本提取,比如<a href="https://github.com/deanmalmgren/textract" rel="nofollow noreferrer">textract</a>,但是首先将文本文件保存为纯文本可能更容易。你知道吗</p>