Я хочу сделать работу hadoop, отображая входные данные, которые из файла и кассандры одновременно
это возможно?
Я знаю способы получения файлов входных файлов из каталога
или введите данные из кассандры.
но я не уверен, что способ получить каждый вход от них возможен.
вот еще несколько подсказок, чтобы описать мою ситуацию.
Формат данных такой же.
такой файл:
ключ значение1 значение2 значение3
...
структура столбца кассандры, подобная этой:
ключевой столбец | имя столбца1 | имя столбца 2 | имя столбца 3
значение ключа | значение столбца1 | столбец vlaue2 | значение столбца 3
...
Мне нужно извлечь из них строку, а затем сравнить данные на основе каждого ключа.
да, я могу получить дубликаты ключей или новые ключи или удаленные ключи.
спасибо.