По сути, Hadoop позволяет вам отправлять свои собственные классы Java в кластер для запуска на соответствующих серверах в соответствующее время. Все API-интерфейсы, не относящиеся к JVM, для Hadoop, в основном, включают в себя запуск уже существующих классов Java, поэтому ничего сложного невозможно.
Кроме того, hadoop не является действительно интерактивной структурой. Он предназначен для пакетной обработки огромного количества данных за несколько разумных промежутков времени. Практическое правило гласит: если вы выполняете подзадачу менее чем 15 МБ за один шаг, вам не следует беспокоиться о hadoop. Затраты на настройку задания, перетасовку данных и результатов просто убьют вас.
Ничто не мешает вам создать свой собственный API Hadoop для PHP так же, как это делается для Python. Тем не менее, PHP не очень популярен среди тех, кто занимается крупномасштабной обработкой данных.