Согласно ответу, сделанному на Преобразование Spark DataFrame в объект Pojo Я узнал, что Dataframe
- это псевдоним Dataset<Row>
.
В настоящее время я вычислил JavaPairRDD<CityCode, CityStatistics>
, где CityStatistics
- это POJO, содержащий геттеры и сеттеры для таких членов, как: getCityCode()
, getCityName()
, getActivityCode()
, getNumberOfSalaried()
, getNumberOfCompanies()
...
Сценарий Liquibase
создал таблицу статистики, в которой существуют эти поля (CITYCODE
, CITYNAME
, ACTIVITYCODE
...). Я просто должен написать записи.
Каков (или до этого: есть ли) чистый способ сделать что-то подобное из моего JavaPairRDD<CityCode, CityStatistics> citiesStatisticsRDD
?
citiesStatisticsRDD.values()
=> DataSet<CityStatistics>
=> DataSet<Row> (= DataFrame)
=> записать в соединение JDBC с помощью метода dataframe?
Спасибо!