MapReduce выходная группа по каждому элементу из списка значений - PullRequest
0 голосов
/ 30 января 2020

У меня есть работа по уменьшению карты, подобная этой:

Имеется файл, содержащий данные в формате:

1, A, B, ...

2, A, C, ...

...

A, B, C ... являются строками

и другой файл этого формата:

SomeTra sh, 1, Y1

OtherTra sh, 2, Y2

Y1, Y2 являются плавающие числа

Сначала я хочу объединить два ввода по числовому значению. Как это сделать, игнорируя часть tra sh во втором файле с помощью MapReduce? Если мы используем только один маппер и отправляем в него два файла, как мы можем различить guish эти два входа?

Мой окончательный вывод будет выглядеть примерно так:

A, Y1

B, Y1

A, Y2

C, Y2

Как разработать эту программу ? Моя проблема в том, что в данный момент, независимо от того, находится ли список строк в ключе или значении, нам, наконец, нужно разделить их в редукторе и сформировать отдельный ключ для каждого элемента в списке. Другими словами, при наличии списка строк и другого Y, связанного с ним, как мы можем использовать map lower для вывода всех пар (строка в списке, Y)?

...