shanthanu, ваш первый вопрос:
Q) какой язык сценариев подходит для hadoop?
A) Большинство языков сценариев, таких как php, python, perl, ruby bash, хороши.Будет работать любой язык, способный читать из stdin, записывать в sdtout и разбирать табуляцию, и символы новой строки: Hadoop Streaming просто передает строковые представления пар ключ-значение, соединенных с табуляцией, в произвольную программу, которая должна выполняться на каждом узле отслеживания задач..
В большинстве дистрибутивов linux, используемых для настройки кластеров hadoop, python, bash, ruby, perl ... уже установлены, но ничто не помешает свернуть вашу собственную среду исполнения для вашего любимого языка сценариев или скомпилированного языка программирования.
Q) PHP не многопоточный?
A) да, но есть способы, с помощью которых мы можем сделать PHP многопоточными.Например, используйте: pnctl_fork () (но в Windows это не работает)
Вопрос, который вы должны всегда помнить, прежде чем переходить к языкам сценариев с помощью hadoop, не "какой язык сценариев?"потому что все в порядке.
Но разница между java и языком сценариев заключается в том, что «Heart Beat дочерних узлов не будет отправляться на родительские узлы, когда мы используем языки сценариев».