Поскольку вы работаете на локальном компьютере, я предполагаю, что это не кластер. Вы не можете точно сказать, сколько памяти потребуется? Тем не менее, вы можете подойти близко к этому. Вы проверяете размер таблицы в зависимости от используемого дискового пространства. Предположим, что вы mytable
заняли 1GB
жесткого диска, тогда для спарка потребовалось бы больше ОЗУ, потому что движку Spark требовалось немного памяти для его собственной обработки. Попробуйте иметь 2GB
больше, для большей безопасности, чем фактический размер таблицы.
Чтобы проверить размер таблицы в Oracle, вы можете использовать следующий запрос:
select segment_name,segment_type,bytes/1024/1024 MB
from dba_segments
where segment_type='TABLE' and segment_name='<yourtablename>';
Это даст вамрезультат MB
.
Чтобы настроить связанный с JVM параметр в Apache-Spark
, вы можете проверить this .