Я пытаюсь реализовать перекрестное соединение, используя hadoop в Java.Обе стороны соединения достаточно велики, и я не могу сохранить ни одну из них в памяти.Я пробовал несколько вещей, и хотя я понимаю, что PIG / Hive может быть проще, я хотел бы реализовать его на нативном Java.
Я думаю, CompositeInputFormat
может быть способом сделать это, но я не смогнайти любой пример кода.
Я пытался отправить помеченные данные на SequenceFileInputFormat
и устал использовать Reducer
для объединения данных, но это тоже не сработало.(Я могу предоставить более подробную информацию, если это правильный путь).
Есть ли пример кода, на который я могу взглянуть?