如何使用Python读取联机docx文件和webscrape表内容

2024-04-18 15:00:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我正试图从网上抓取一个在线安全的docx文件。我可以通过以下方式成功获得:

r=requests.get(“^a1}”,auth=HttpNtlmAuth('uid','pwd'))

但是现在我被如何读取这个对象以及如何深入挖掘文件结构以提取我需要的内容所困扰


1条回答
网友
1楼 · 发布于 2024-04-18 15:00:26

我发现了一个代码段,我在其中创建了一个.docx文件并将传入的流存储到其中。我将继续搜索如何读取本地文件,但我已经看到了这种搜索的示例

with open('myfile.docx', 'wb') as f:
    for chunk in r.iter_content(1024 * 1024 * 2):  # 2 MB chunks
        f.write(chunk)

相关问题 更多 >