Попытка обработать большой двоичный файл, используя PySpark, но всегда получая OutofMemoryError.Перепробовал все возможные способы, такие как увеличение памяти исполнителя / драйвера, перераспределение rdd.Будет ли один большой двоичный файл разделен на спарк?Если нет, то как мы можем обрабатывать двоичные файлы.Двоичный файл, который я использую в настоящее время, превышает 2 ГБ.