Я новичок в Hadoop.Мне удалось разработать простое приложение Map / Reduce, которое отлично работает в «псевдораспределенном режиме». Я хочу проверить это в «полностью распределенном режиме».У меня есть несколько вопросов по этому поводу:
- Сколько машин (узлов) мне нужно (минимально и рекомендуется) для обработки файлов размером 1-10 ГБ?
- Каковы требования к оборудованию (в основном, я хочу знать количество ядер, объем памяти и дисковое пространство)?