下面的代码下载并解压缩包含数千个文本文件的文件
zip_file_url = "https://docsia-temp.s3-sa-east-1.amazonaws.com/docsia-desafio-dataset.zip"
res = requests.get(zip_file_url, stream=True) # fazendo o request do dado
print("fazendo o download...")
z = zipfile.ZipFile(io.BytesIO(res.content))
print("extraindo os dados")
z.extractall("./")
print("ok..")
如何将这些文件加载到数据帧中
pathlib
模块查找已解压缩的文件dfc = pd.concat(dd.values()).reset_index(drop=True)
'type'
列的原因。在组合数据框中,项目类型将是可识别的李>相关问题 更多 >
编程相关推荐