在Python中使用Lambda和AW将文件写入S3

def pdfToTable(PDFfilename, apiKey, fileExt, bucket, key): # parsing a PDF using an API fileData = (PDFfilename, open(PDFfilename, "rb")) files = {"f": fileData} postUrl = "https://pdftables.com/api?key={0}&format={1}".format(apiKey, fileExt) response = requests.post(postUrl, files=files) response.raise_for_status() # this code is probably the problem! s3 = boto3.resource('s3') bucket = s3.Bucket('transportation.manifests.parsed') with open('/tmp/output2.csv', 'rb') as data: data.write(response.content) key = 'csv/' + key bucket.upload_fileobj(data, key)

2条回答

网友

1楼 · 编辑于 2024-04-27 03:29:05

假设Python 3.6。我通常这样做的方式是将字节内容包装在BytesIO包装器中，以创建类似文件的对象。而且，根据boto3文档，您可以使用the-transfer-manager进行托管传输：

from io import BytesIO
import boto3
s3 = boto3.client('s3')

fileobj = BytesIO(response.content)

s3.upload_fileobj(fileobj, 'mybucket', 'mykey')

如果这不起作用，我会再次检查所有IAM权限是否正确。

网友

2楼 · 编辑于 2024-04-27 03:29:05

您有一个可写的流，您要求boto3用作一个不起作用的可读流。

编写文件，然后简单地使用bucket.upload_file（），如下所示：

s3 = boto3.resource('s3')
bucket = s3.Bucket('transportation.manifests.parsed')
with open('/tmp/output2.csv', 'w') as data:
    data.write(response.content)

key = 'csv/' + key
bucket.upload_file('/tmp/output2.csv', key)

相关问题更多 >

编程相关推荐

热门问题

热门文章