Question

У меня есть массивный статический набор данных, и у меня есть функция для его применения.

f находится в форме Reduce (map (f, набор данных)), поэтому я бы использовал скелет MapReduce. Тем не менее, я не хочу разбрасывать данные при каждом запросе (и в идеале я хочу использовать индексирование для ускорения f). Есть реализация MapReduce, которая обращается к этому общему случаю?

Я посмотрел на IterativeMapReduce и, возможно, он выполняет свою работу, но, похоже, решает немного другой случай, а код еще не доступен.

akappa · Answer 1 · 07 февраля 2010

MapReduce Hadoop (и все остальные скелеты сокращения карт, вдохновленные Google) не разбрасывают данные все время.

Эффективный MapReduce при работе с потоками для запросов к одному и тому же набору данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Эффективный MapReduce при работе с потоками для запросов к одному и тому же набору данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы