Question

Я понимаю, что take (n) вернет n элементов СДР, но как Spark решает, из какого раздела вызывать эти элементы и какие элементы следует выбрать? Поддерживает ли он внутренние индексы для Driver?

mkhan · Answer 1 · 25 марта 2019

В методе RDD take (n) Spark начинает поиск элементов из первого раздела. Если в нем недостаточно элементов, Spark увеличивает количество сканируемых разделов. А что за элементы взяты, это определяется следующей строкой

val res = sc.runJob(this, (it: Iterator[T]) => it.take(left).toArray, p)

Метод take (n) Итератора в scala говорит: «Выбирает первые« n »значения этого итератора.» - scaladoc . Что касается того, какие элементы будут выбраны, мы видим, что элементы выбираются с начала итератора.

Как метод RDD take () работает внутри?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как метод RDD take () работает внутри?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов