Я просматривал статью, касающуюся API обработки изображений HIPI для Hadoop, по адресу: http://cs.ucsb.edu/~cmsweeney/papers/undergrad_thesis.pdf
При объяснении примера ковариации в этом документе говорится: «Поскольку HIPI выделяет одно изображение назадача карты, это просто случайная выборка изображения для 100 патчей и выполнение этого вычисления ".
Но самая первая фигура, показанная в статье, изображает архитектуру с несколькими изображениями, вводимыми в одну задачу карты!
И удивительно, что они написали, что одно изображение обрабатывается одной задачей карты, потому что это порождает слишком много задач карты, так как они также решают проблему небольших файлов.
Если это так, то файл последовательности с MultithreadedMapper - лучшая альтернатива, я прав или нет?
Заранее спасибо ..