擅长:python、mysql、java
<p>如PDF规范中所述:
<a href="http://www.adobe.com/devnet/pdf/pdf_reference.html" rel="nofollow">http://www.adobe.com/devnet/pdf/pdf_reference.html</a></p>
<p>文档目录中有一个“/Lang”键。在我的PDF规范版本中,第7.7.2节对此进行了解释。在</p>
<p>此语言键定义整个文档的假定语言,但标记不同的部分除外。在</p>
<p>所以,有两个注意事项:
1) 此“/Lang”键是可选的。如果没有的话,PDF规范说明语言是未定义的。在</p>
<p>2)此“/Lang”键可能被文件中的其他元素覆盖。因此,整个文档可能是英语,但第101页上的特定句子可能会将语言重新定义为法语。在</p>
<p>在您的例子中,您的算法应该首先尝试找到上面定义的整个文档语言。如果没有,那就看你怎么办了。您可以在整个文档中搜索“/Lang”键,看看是否找到其他键,但如果找到多个键,则必须确定这意味着什么。。。在</p>