Что люди подразумевают под «промежуточными результатами», когда говорят о Hadoop, Spark и Big Data? - PullRequest
0 голосов
/ 29 сентября 2019

Я пытаюсь узнать немного больше о больших данных, особенно в отношении использования Hadoop и Spark. Тем не менее, я продолжаю видеть этот термин «промежуточные результаты», и я не совсем уверен, что он имеет в виду.

Например, я прочитал, что «Hadoop записывает промежуточные результаты на диск хранения компьютера, а Spark сохраняет эти же результаты в памяти, когда это возможно». Я предполагал, что это относится к результатам после Map Reduce, но я не совсем уверен.

Может ли кто-нибудь немного подробнее рассказать о том, что такое "промежуточные результаты" и как они могут варьироваться между Spark и Hadoop?

1 Ответ

0 голосов
/ 30 сентября 2019

Между фазой карты и фазой сокращения выполняется операция перестановки и сортировки обрабатываемых данных, которая является промежуточной по отношению ко всей операции

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...