Scala Spark IntelliJ Процесс разработки идеи - PullRequest
0 голосов
/ 27 июня 2018

В настоящее время я использую spark для написания моей модели размерных данных, и сейчас мы загружаем jar в кластер AWS EMR для тестирования. Однако, это утомительно и требует много времени для тестирования и построения таблиц.

Я хотел бы знать, что делают другие, чтобы ускорить свое развитие. Возможности, с которыми я столкнулся в своем исследовании, - это запуск искровых заданий непосредственно из IDE с Intellij Idea, и я хотел бы узнать о других процессах разработки, которые используются там, где они быстрее развиваются.

1 Ответ

0 голосов
/ 27 июня 2018

Пути, которые я пробовал до сих пор:

  1. Установка spark и hdfs на два или три обычных ПК и тестирование кода перед его отправкой в ​​кластер.
  2. Запуск кода на одном узле, чтобы избежать фиктивных ошибок.
  3. Отправка файла JAR в кластер.

Аналогичная часть в первом и третьем способе делает файл JAR, который может занять много времени. Второй не подходит для поиска и исправления ошибок и проблем, а также для их устранения в распределенных средах.

...