Question

Я пытаюсь написать оценщик искры в Streamsets.Я имею дело со сложными запросами SQL и, следовательно, хотел бы использовать фреймы данных или наборы данных здесь.Но пример кода, который предоставляет Streamsets, имеет дело только с JavaRDD.Мне нужно будет преобразовать JavaRDD в наборы данных, а затем после выполнения spark SQL преобразовать обратно в JavaRDD.Это выходит из-под контроля из-за сложности, так как простые .toJavaRDD () и toDF не работают.Я пытаюсь сопоставить JavaRDD с набором данных, используя createDataFrame и класс bean, но это создает проблему компиляции.Могу ли я иметь фиктивный код, чтобы получить здесь преимущество?

metadaddy · Answer 1 · 21 сентября 2019

Вам почти наверняка лучше взглянуть на StreamSets Transformer .Transformer имеет более глубокую интеграцию с Spark и позволит вам работать с собственными структурами Spark.

Пример кода Spark Evaluator для Streamsets

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пример кода Spark Evaluator для Streamsets

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы