Question

У меня есть набор данных Spark dataset. Мне нужно сделать .collectAsList() для каждого столбца набора данных. Как я могу использовать .persist() и .unpersist(), чтобы избежать огромного времени на операции?

Поскольку я новичок, я не уверен, как мне использовать постоянные функции. Нужно ли мне назначать это для набора данных как dataset=dataset.persist(); или просто dataset.persist() поможет?

Gaurav · Answer 1 · 02 июля 2018

если вы просто хотите кешировать набор данных, используйте dataset.persist (). Аналогично, dataset.unpersist () удаляет все блоки для него из памяти.

Использование dataset.persisit () и dataset.unpersist () в Java

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Использование dataset.persisit () и dataset.unpersist () в Java

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы