使用Lambda将转录的json文件存储到s3中的特定文件夹中

2024-06-16 10:35:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我跟随这个(https://towardsdatascience.com/speech-to-text-using-aws-transcribe-s3-and-lambda-a6e88fb3a48e)博客创建一个转录文件。视频从控制台上传到S3,并触发lambda函数,该函数调用转录API并将该文件存储在目标存储桶中。所以一切都很顺利

但它将文件放在S3的根文件夹中。我想在Lambda代码中给出目标bucket中的前缀。这意味着我希望以这样的方式存储转录的文件s3://<bucketname>/<folder1>/transcibe.json

我在OutputBucketName(代码中的第32行)上尝试了多种方法,但仍然没有任何效果

import boto3
import uuid
import json

def lambda_handler(event, context):

    record = event['Records'][0]
    print(record)
    
    s3bucket = record['s3']['bucket']['name']
    s3object = record['s3']['object']['key']
    sourcekey=s3object
    
    s3Path = "s3://" + s3bucket + "/" + s3object
    print(s3Path)
    print(s3object.split("/"))
    
    jobName = (s3object[-1]) + '-' + str(uuid.uuid4())
    destkey = sourcekey-s3object[-1] 
    print(destkey)

    client = boto3.client('transcribe')

    response = client.start_transcription_job(
        TranscriptionJobName=jobName,
        LanguageCode='en-GB',
        MediaFormat='mp4',
        Media={
            'MediaFileUri': s3Path
        },
        OutputKey=destkey,
        OutputBucketName = "destination-bucket-name"
    )


    return {
        'TranscriptionJobName': response['TranscriptionJob']['TranscriptionJobName']
    }

Tags: 文件lambdaimportclient目标s3bucketrecord