Пример кода Spark Evaluator для Streamsets - PullRequest
1 голос
/ 19 сентября 2019

Я пытаюсь написать оценщик искры в Streamsets.Я имею дело со сложными запросами SQL и, следовательно, хотел бы использовать фреймы данных или наборы данных здесь.Но пример кода, который предоставляет Streamsets, имеет дело только с JavaRDD.Мне нужно будет преобразовать JavaRDD в наборы данных, а затем после выполнения spark SQL преобразовать обратно в JavaRDD.Это выходит из-под контроля из-за сложности, так как простые .toJavaRDD () и toDF не работают.Я пытаюсь сопоставить JavaRDD с набором данных, используя createDataFrame и класс bean, но это создает проблему компиляции.Могу ли я иметь фиктивный код, чтобы получить здесь преимущество?

1 Ответ

0 голосов
/ 21 сентября 2019

Вам почти наверняка лучше взглянуть на StreamSets Transformer .Transformer имеет более глубокую интеграцию с Spark и позволит вам работать с собственными структурами Spark.

...