Как Spark выполняет ввод / вывод? - PullRequest
0 голосов
/ 30 октября 2018

Насколько я понимаю, Spark использует параллельный ввод-вывод для чтения файлов. Этот вывод приходит из других ответов переполнения стека.

Мой вопрос заключается в том, позволяет ли спарк читать данные, используя независимый подход или коллективный подход? Другими словами, каждый работник читает набор данных или рабочие общаются друг с другом и сотрудничают для эффективного чтения данных?

Ответы [ 2 ]

0 голосов
/ 08 ноября 2018

рабочие общаются водителем, и каждый рабочий обрабатывает свои собственные данные

0 голосов
/ 30 октября 2018

Каждый Работник Apache Spark имеет Исполнителей, Рабочие могут быть развернуты в распределенном или автономном режиме.
Каждый работник обрабатывает свои собственные данные, которые он обрабатывает. Подробнее см. Этот ответ или ссылку

...