AWS лямбда-чтение zip-файла выполнить проверку и распаковать в корзину s3, если проверка пройдена - PullRequest
0 голосов
/ 16 июня 2020
• 1000 содержит ниже:
a.csv b.csv c.csv trigger_file.txt

trigger_file.txt - содержать имена файлов в zip и количество записей (пример: a.csv: 120, b.csv: 10, c .csv: 50)

Итак, используя лямбду, мне нужно прочитать файл триггера, проверить, равно ли количество файлов в zip папке количеству файлов, указанных в файле триггера, если передать распаковку в ведро s3.

Код ниже, который я подготовил :

def write_to_s3(config_dict):
    inp_bucket = config_dict["inp_bucket"]
    inp_key = config_dict["inp_key"]
    out_bucket = config_dict["out_bucket"]
    des_key = config_dict["des_key"]
    processed_key = config_dict["processed_key"]

    obj = S3_CLIENT.get_object(Bucket=inp_bucket, Key=inp_key)
    putObjects = []
    with io.BytesIO(obj["Body"].read()) as tf:
        # rewind the file

    # Read the file as a zipfile perform transformations and process the members
    with zipfile.ZipFile(tf, mode='r') as zipf:
        for file in zipf.infolist():
            fileName = file.filename
            print("file name before while loop :",fileName)
                found = False
                while not found :
                    if fileName == "Trigger_file.txt" :
                        with , 'r') as thefile:
                            my_list = [i.decode('utf8').split(' ') for i in thefile]
                            my_list = str(my_list)[1:-1]
                            print("my_list :",my_list)
                            print("fileName :",fileName)
                            found = True
                        print("Trigger file not found ,try again")
            except Exception as exp_handler:
                    raise exp_handler

            if 'csv' in fileName :
                    if fileName in my_list:
                        print("Validation Success , all files in Trigger file  are present procced for extraction")
                        print("Validation Failed")
                except Exception as exp_handler:
                    raise exp_handler

    # *****FUNCTION TO UNZIP ********

def lambda_handler(event, context):
        inp_bucket = event['Records'][0]['s3']['bucket']['name']
        inp_key = urllib.parse.unquote_plus(event['Records'][0]['s3']['object']['key'], encoding='utf-8')
        config_dict = build_conf_obj(os.environ['config_bucket'],os.environ['config_file'], os.environ['param_name'])
    except Exception as exp_handler:

Все шло хорошо, единственная проблема, с которой я столкнулся, - это часть проверки, я думаю, что хотя l oop неверно, так как он переходит в бесконечное l oop.


Найдите файл trigger_file.txt в zip-папке, если он найден, затем прервите проверку l oop do и разархивируйте его в папку s3. Если не найден, продолжайте поиск до конца dict.

ВЫВОД ОШИБКИ (тайм-аут):

  "errorMessage": "2020-06-16T20:09:06.168Z 39253b98-db87-4e65-b288-b585d268ac5f Task timed out after 60.06 seconds"

Request ID:

Function Logs:
Trigger file not found ,try again
Trigger file not found ,try again
Trigger file not found ,try again
Trigger file not found ,try again
Trigger file not found ,trEND RequestId: 39253b98-db87-4e65-b288-b585d268ac5f
REPORT RequestId: 39253b98-db87-4e65-b288-b585d268ac5f  Duration: 60060.06 ms   Billed Duration: 60000 ms   Memory Size: 3008 MB    Max Memory Used: 83 MB  Init Duration: 389.65 ms    
2020-06-16T20:09:06.168Z 39253

1 Ответ

1 голос
/ 18 июня 2020

В следующем, пока l oop в вашем коде, если fileName не "Trigger_file.txt", он попадает в бесконечное l oop.

found = False
while not found:
    if fileName == "Trigger_file.txt":
        with , 'r') as thefile:
            my_list = [i.decode('utf8').split(' ') for i in thefile]
            my_list = str(my_list)[1:-1]
            print("my_list :",my_list)
            print("fileName :",fileName)
            found = True
        print("Trigger file not found ,try again")

Думаю, вы можете заменить часть кода функции write_to_s3 следующим кодом:

def write_to_s3(config_dict):

    #### Do something ####

    # Read the file as a zipfile perform transformations and process the members
    with zipfile.ZipFile(tf, mode='r') as zipf:
        found = False
        for file in zipf.infolist():
            fileName = file.filename
            if fileName == "Trigger_file.txt":
                with, 'r') as thefile:
                    my_list = [i.decode('utf8').split(' ') for i in thefile]
                    my_list = str(my_list)[1:-1]
                    print("my_list :", my_list)
                    print("fileName :", fileName)
                    found = True

        if found is False:
            print("Trigger file not found ,try again")

        for file in zipf.infolist():
            fileName = file.filename
            if 'csv' in fileName:
                if fileName not in my_list:
                    print("Validation Failed")

        print("Validation Success , all files in Trigger file  are present procced for extraction")

    # *****FUNCTION TO UNZIP ********