Разбиение большого двоичного файла с использованием pyspark

Попытка обработать большой двоичный файл, используя PySpark, но всегда получая OutofMemoryError.Перепробовал все возможные способы, такие как увеличение памяти исполнителя / драйвера, перераспределение rdd.Будет ли один большой двоичный файл разделен на спарк?Если нет, то как мы можем обрабатывать двоичные файлы.Двоичный файл, который я использую в настоящее время, превышает 2 ГБ.

Разбиение большого двоичного файла с использованием pyspark

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Разбиение большого двоичного файла с использованием pyspark

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы