Apache POI 与 Python xlrd

6 投票
2 回答
7181 浏览
提问于 2025-04-16 17:44

我打算在Linux上用apache poi或者python xlrd来读取电子表格。我个人比较倾向于使用python xlrd,但我觉得apache poi这个项目更完整一些(可能是因为它得到了apache基金会的支持)。那么,哪个选择更好呢(我还是偏向python,但还是想知道)?我希望能读取大部分版本的Excel文件,并且能读取宏。

2 个回答

0

一个可能让你同时享受到两种好处的选择是通过 Jython 使用 Apache POI(这是一种用 Python 语法与 Java 互操作的工具)。

这里有一个旧版的 Jython 示例……我觉得这个示例需要根据更新的 POI 版本进行修改。

3

根据你的需求复杂程度,你可以考虑直接使用Apache Tika的命令行工具。Tika可以和POI(还有其他库)进行沟通,最后会给你一个XHTML格式或者纯文本的文档。如果你只想要一个简单的Linux命令,这可能就足够了。

如果不行,那就要看你的Java水平如何了。POI可以满足你所有的需求,但你需要写一点代码来提取你感兴趣的部分。可以看看快速指南,这能帮助你入门。

(关于xlrd的情况我不太清楚,抱歉)

撰写回答