如何在php/python中将pdf、ppt、xl、doc文件内容读取为字符串
请给我推荐一些内置的命令或包吗?
3 个回答
0
试试这个:
$data = fopen('myfile.png', 'rb'); // read in binary mode.
if ($data) {
header('Content-Type: image/png');
fpassthru($data);
}
你需要相应地更改 content-type
。
1
你是想问文件的内容是以“二进制”形式,还是以实际的文本形式呢?
如果你想在PHP中以“二进制”方式读取文件,可以参考这个链接:http://php.net/manual/en/function.file.php
在Python中,你可以查看这个链接来了解如何读取文件:http://docs.python.org/tutorial/inputoutput.html#reading-and-writing-files
实际上,读取文件的内容要复杂得多,还需要额外的库支持。比如,你可以看看这个在Stack Overflow上的问题(关于Python):python convert microsoft office docs to plain text on linux