Мой вопрос теоретический,
Я пытаюсь создать дизайн для примера mapreduce в области обработки больших данных.
В моем случае пара ключей должна быть сопоставлена с парой значений.
например, если у нас есть текст ниже:
«Инженер-бакалавр имеет опыт работы 5 лет»
Я пытаюсь посчитать слова «Инженерия и опыт» так, чтобы у меня было значение для каждого слова в отдельности.
Таким образом, мой ключ будет (Инженерное дело, Опыт), а мое значение будет (1,1), как в приведенном выше текстовом примере.
Обратите внимание, что в моей домашней работе есть взаимосвязь между обоими значениями ключей, поэтому я хочу, чтобы они оба в одном наборе значений ключей определяли, упоминаются ли оба ключа в одном текстовом файле, или упоминается только один ключ, или ни один не упомянут.
Пожалуйста, дайте мне знать, если описанный выше случай можно сделать при уменьшении больших данных или нет.