Question

Я новичок в бигдате и улье. Нужно работать с другим разработчиком приложения для потокового воспроизведения, где оно включает чтение из Kafka и размещение его в hive / hdfs. Другой разработчик использует / указывает на то же местоположение hdfs, читает файлы куста и выполняет дальнейшую обработку.

Моя среда разработки - Eclipse в моей системе Windows. Другой разработчик env - Eclipse на своей машине.

Поскольку оба работают над одними и теми же файлами, есть ли способ разделить путь hdfs между нами?

Пожалуйста, поделитесь подробностями о том, как такие сценарии обрабатывались в командах разработчиков спарк?

Советы, лучшие практики и пр.

Большое спасибо, Shyam

Nikk · Answer 1 · 18 июня 2019

Вам необходимо настроить многоузловой кластер hadoop и настроить все системные IP-адреса разработчика как датоданы, чтобы они могли использовать одну и ту же HDFS.

Основной файл конфигурации для Hadoop: core-site.xml, hdfs-site.xml, mapred-site.xml & yarn-site.xml

Как только это будет сделаноВы можете установить Hive и Spark поверх HDFS.

См. Ссылки для установки: https://www.linode.com/docs/databases/hadoop/how-to-install-and-set-up-hadoop-cluster/ https://dzone.com/articles/setting-up-multi-node-hadoop-cluster-just-got-easy-2

Есть ли возможность поделиться / получить доступ к hdfs среди разработчиков?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Есть ли возможность поделиться / получить доступ к hdfs среди разработчиков?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы