API HIPI: обрабатывает ли он 1 изображение на задачу карты? - PullRequest
1 голос
/ 23 марта 2012

Я просматривал статью, касающуюся API обработки изображений HIPI для Hadoop, по адресу: http://cs.ucsb.edu/~cmsweeney/papers/undergrad_thesis.pdf

При объяснении примера ковариации в этом документе говорится: «Поскольку HIPI выделяет одно изображение назадача карты, это просто случайная выборка изображения для 100 патчей и выполнение этого вычисления ".

Но самая первая фигура, показанная в статье, изображает архитектуру с несколькими изображениями, вводимыми в одну задачу карты!

И удивительно, что они написали, что одно изображение обрабатывается одной задачей карты, потому что это порождает слишком много задач карты, так как они также решают проблему небольших файлов.

Если это так, то файл последовательности с MultithreadedMapper - лучшая альтернатива, я прав или нет?

Заранее спасибо ..

1 Ответ

0 голосов
/ 17 мая 2012

Хотя я не могу объяснить, что автор говорит в статье, глядя на API для HIPI, я вижу только один InputFormat:

Это работает с ImageBundle, который, как звучит, - это набор (связка) изображений в одном файле.

Я думаю, что автор, вероятно, пытается сказать:

Поскольку HIPI выделяет одно изображение для функции карты , просто случайным образом выбрать изображение для 100 патчей и выполнить этот расчет

Просмотр кода для соответствующего примера ковариации подтверждает эту теорию.

...