XLRDError:不支持的格式或损坏的文件:预期的BOF记录;找到b'\r\n\r\n<!'

2024-04-28 05:35:58 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前正在使用python来解释和添加存储在xlsx文件中的数据。我正在尝试将数据存储在SharePoint中,但无法使用该信息。当我运行下面的请求时,我得到Out[6]: <Response [200]>,所以我知道它响应了请求

import requests
import json
from json import loads
import pandas as pd
from requests_negotiate_sspi import HttpNegotiateAuth
headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36"}
requests.get('OneDrive file address',auth=HttpNegotiateAuth(),headers=headers)

然而,我尝试了多种方法将这些数据放在熊猫数据框架中,每次都面临困难。当我试图转换为JSON时,我会得到相同的错误:JSONDecodeError: Expecting value: line 3 column 1 (char 4)。我找到的大多数解决方案都是针对第1行第1列(char 0),对我的解决方案不起作用。这是我尝试转换的方法之一

import requests
import json
from json import loads
import pandas as pd
from requests_negotiate_sspi import HttpNegotiateAuth
headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36"}
tern=requests.get('One Drive Address',auth=HttpNegotiateAuth(),headers=headers)
tern_dict=tern.json()
db=pd.DataFrame.from_dict(tern_dict)
print(db)

我遇到的另一个主要错误是,我试图直接将该文件视为excel文件:XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\r\n\r\n<!--' 这将通过使用类似于

import requests
import json
from json import loads
import pandas as pd
from requests_negotiate_sspi import HttpNegotiateAuth
headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36"}
tern=requests.get('One Drive Address',auth=HttpNegotiateAuth(),headers=headers)
df=pd.read_excel(tern)

我尝试运行df=pd.read_html(tern),但错误是ValueError: No tables found

我如何使用该函数来处理数据?在我的初始版本中,我只是在本地文件上使用了open(),并在每一行数据上运行了for循环,因此我希望能够使用联机文件执行此操作,以便多个用户访问同一信息源。我很抱歉,如果有任何不清楚的地方,我仍然是相当新的编程这一深入


Tags: 文件数据fromimportjsonpandasasrequests