Я использую spark-cassandra-connector. Необходим для извлечения данных из таблицы оракулов.
У меня есть столбцы "fiscal_year" и "date_of_creation".
в настоящее время я установил
.option("lowerBound", 2000);
.option("upperBound",2020);
.option("partitionColumn", "fiscal_year");
// это работает, но в результате получается много искажений в данных. в результате искры работают в течение нескольких часов.
Следовательно, мы хотели бы использовать столбец "date_of_creation" в качестве ключа разделения, как показано ниже
.option("lowerBound", "31-MAR-02");
.option("upperBound", "01-MAY-19");
.option("partitionColumn", "date_of_creation");
Но выдает ошибку типа "ORA-00932: несовместимые типы данных: ожидаемая дата получена NUMBER"
что здесь не так?
Есть ли возможность установить несколько столбцов как
option("partitionColumn", ["date_of_creation" ,"fiscal_year"]);
для некоторых записей в таблице оракула, если "fiscal_year" равно нулю, как написать пользовательский разделитель в этом случае?