如何使用Python读取联机docx文件和webscrape表内容

2024-04-18 15:00:26 发布

男 | 程序猿一只，喜欢编程写python代码。

我正试图从网上抓取一个在线安全的docx文件。我可以通过以下方式成功获得：

r=requests.get（“^a1}”，auth=HttpNtlmAuth（'uid'，'pwd'））

但是现在我被如何读取这个对象以及如何深入挖掘文件结构以提取我需要的内容所困扰

1条回答

网友

1楼 · 发布于 2024-04-18 15:00:26

我发现了一个代码段，我在其中创建了一个.docx文件并将传入的流存储到其中。我将继续搜索如何读取本地文件，但我已经看到了这种搜索的示例

with open('myfile.docx', 'wb') as f:
    for chunk in r.iter_content(1024 * 1024 * 2):  # 2 MB chunks
        f.write(chunk)