Spark RDD написать Кассандре - PullRequest
0 голосов
/ 01 июля 2019

У меня есть приведенная ниже схема Cassandra Table.

ColumnA Primary Key
ColumnB Clustering Key
ColumnC
ColumnD

Теперь у меня есть Spark RDD со столбцами, упорядоченными как RDD [ColumnC, ColumnA, ColumnB, ColumnD]

Итак, когдаЯ пишу в Таблицу Кассандры, мне нужно убедиться, что порядок правильный.Итак, мне нужно указать порядок столбцов с помощью SomeColumns

rdd.saveToCassandra(keyspace,table,SomeColumns("ColumnA","ColumnB","ColumnC","ColumnD))

Можно ли как-нибудь передать все имена столбцов в виде списка?Я спрашиваю, что у меня в целевой таблице около 140 столбцов, и я не могу назвать все имена как часть SomeColumns.Итак, в поисках более чистого подхода.

PS: я не могу записать его из DataFrame, я ищу только решение, основанное на RDD.

1 Ответ

1 голос
/ 01 июля 2019

Вы можете использовать следующий синтаксис, чтобы разбить последовательность в список аргументов:

SomeColumns(names_as_sequence: _*)

Обновление:

Если у вас есть последовательность имен столбцов в виде строк, то вам нужно сделать:

SomeColumns(names_as_string_seq.map(x => x.as(x)): _*)
...