У меня есть данные с SQL Server, которыми я должен манипулировать в Apache Spark (блоки данных).
В SQL Server три ключевых столбца этой таблицы используют параметр COLLATION с учетом регистра, так что эти конкретные столбцы чувствительны к регистру, а другие в таблице - нет. Эти столбцы являются короткими буквенно-цифровыми идентификаторами из приложения поставщика, и мы должны иметь возможность использовать их с учетом регистра в предикатах и условиях соединения, а также использовать другие без учета регистра.
Таблица была экспортирована как CSV.
Есть ли способ смешать сравнения столбцов с учетом регистра и без учета регистра в DataFrame, кроме использования нижних и верхних функций? Я также могу импортировать этот CSV-файл в таблицу блоков данных, но, похоже, он не предлагает аналогичные параметры сортировки на уровне метаданных для объединений.
Спасибо.