Я смотрю на решения проблемы, которая включает чтение ключевых данных из более чем одного файла.На одном шаге карты мне нужны все значения для определенного ключа в одном и том же месте одновременно.Я вижу в книге Уайта дискуссию о «перемешивании», и у меня возникает соблазн задаться вопросом, сортируются ли данные по ключу, когда вы выходите из слияния и ввода в редуктор, если есть все данные для ключа…могу рассчитывать на это.
Большие картинки: я хочу создать федерацию тройного магазина для бедного человека, а тройки, которые я хочу загрузить в хранилище в памяти, не все из одного файла.,Это вертикальный (?) Раздел, в котором значения для определенного ключа находятся в разных файлах.Иными словами, каждый столбец для полной записи взят из разных файлов.Собирает ли Hadoop это?... хотя бы для одного ключа за раз.