Question

В Spark устойчивые распределенные наборы данных (RDD) - это API-интерфейсы низкого уровня, а фреймы данных - это API-интерфейсы высокого уровня, поэтому мой вопрос: когда использовать API-интерфейсы низкого уровня?

swapnil shashank · Answer 1 · 06 февраля 2019

Spark имеет два основных набора API: низкоуровневые «неструктурированные» API и высокоуровневые структурированные API.

СДР может обрабатывать как структурированные, так и неструктурированные данные, когда в качестве фрейма данных данные организуются в виде столбцов в виде строки, поэтому они работают со структурированными данными.При необходимости вы можете преобразовать фрейм данных в rdd.

Обычно люди используют фрейм данных и, следовательно, API высокого уровня, так как он дает больше возможностей.Но это зависит исключительно от вашего требования.

Я предложу вам прочитать либо такие книги, как «Learning Spark» или «Spark - The Definition Guide», для получения дополнительных разъяснений.

Когда использовать API низкого уровня?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Когда использовать API низкого уровня?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы