Для # 1, если вы получили файлы * -site.xml из кластера, возможно, они используют внутренние IP-адреса для ссылки на такие компоненты, как узлы данных, и вы не сможете получить к ним доступ напрямую, используя это.Попробуйте установить dfs.client.use.datanode.hostname
в значение true в вашем hdfs-site.xml на клиенте.
Для # 2 я не уверен, что PutHiveStreaming будет работать против Cloudera, IIRC они используют Hive 1.1.x и PutHiveStreaming основанна 1.2.x, поэтому могут быть некоторые несовместимости с Thrift.Если это не похоже на проблему, убедитесь, что клиент может подключиться к порту метастаза (выглядит как 9083).