Question

Насколько я понимаю, Spark использует параллельный ввод-вывод для чтения файлов. Этот вывод приходит из других ответов переполнения стека.

Мой вопрос заключается в том, позволяет ли спарк читать данные, используя независимый подход или коллективный подход? Другими словами, каждый работник читает набор данных или рабочие общаются друг с другом и сотрудничают для эффективного чтения данных?

Onizuka · Answer 1 · 08 ноября 2018

рабочие общаются водителем, и каждый рабочий обрабатывает свои собственные данные

Yugerten · Answer 2 · 30 октября 2018

Каждый Работник Apache Spark имеет Исполнителей, Рабочие могут быть развернуты в распределенном или автономном режиме.
Каждый работник обрабатывает свои собственные данные, которые он обрабатывает. Подробнее см. Этот ответ или ссылку

Как Spark выполняет ввод / вывод?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как Spark выполняет ввод / вывод?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы