Я пытаюсь создать небольшую среду контроля качества для моего продукта, в которой используется Hadoop. Мои требования малы, поэтому я предполагаю, что небольшой кластер из 3-4 узлов. Меня беспокоит не только спецификация оборудования для построения этой среды, но и лучшие практики и другие инструменты, которые должны быть включены с точки зрения инфраструктуры и практики. Скажем, вы должны были начать с нуля - что бы вы имели в QA? Вот то, что я могу думать о
1. 3 узла серверного класса машин,
2. инструменты отслеживания ошибок, инструменты покрытия кода,
3. сервер непрерывной интеграции
4. мрунит?)