pyspark - захватывает искаженное имя файла JSON после сбоя загрузки с опцией FAILFAST

Чтобы обнаружить неправильно сформированный / поврежденный / неполный файл JSON, я использовал опцию FAILFAST, чтобы процесс не удался. Как мне получить поврежденное имя файла из файлов 100s, потому что мне нужно удалить этот файл из пути и скопировать хорошую версию файла из корзины s3?

df = spark_session.read.json(table.load_path, mode='FAILFAST').cache()

pyspark - захватывает искаженное имя файла JSON после сбоя загрузки с опцией FAILFAST

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

pyspark - захватывает искаженное имя файла JSON после сбоя загрузки с опцией FAILFAST

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы