擅长:python、mysql、java
<p>PDFMiner是您的一个选项,并且<a href="https://github.com/dpapathanasiou/pdfminer-layout-scanner/blob/master/layout_scanner.py" rel="nofollow noreferrer">this is an example</a>从PDF页面提取文本。在</p>
<p>出于您的目的,您必须将第176行改为</p>
<pre><code>' '.join(text_content)
</code></pre>
<p>这将删除换行符。在</p>