как нам спроектировать маппер / редуктор, если мне нужно построчно преобразовывать текстовый файл в...
Я начинаю личный проект, который включает в себя хранение большой базы данных объектов и отношений...
Я новичок в распределенных базах данных NoSQL, таких как Hadoop, Cassandra и т. Д. У меня есть...
Я новичок в этом, и мое требование заключается в следующем: Я хочу обработать огромный набор данных...
У нас есть собственный формат ввода, расширяющий FileInputFormat, который генерирует отдельное...
Я использую карту упругости Amazon. У меня есть файлы журналов, которые выглядят примерно так...
Я давно над этим работаю и чувствую себя очень измученным;Я надеюсь на [очевидное?] Понимание со...
У меня есть таблица HBASE, содержащая около 150 тыс. Строк, каждая из которых содержит 3700...
Я пытаюсь запустить простой пример с использованием двоичного исполняемого файла и кэшированного...
Хотите понять, является ли Netezza или Hadoop правильным выбором для следующих целей: Извлечение...
Я новичок в hadoop.У меня есть задание MapReduce, которое должно получать входные данные из Hdfs и...
Я хочу использовать несколько файлов (фактически 2 файла) в качестве входных файлов. они имеют...
Я написал простой код кластеризации k-средних для Hadoop (две отдельные программы - маппер и...
Кто-нибудь знает, что не так с hbase?Я использую vm-образ дистрибутива cloudera для hadoop, раньше...
Я в настоящее время очень случайный пользователь Apache Mahout , и я рассматриваю возможность...
Наменод в архитектуре Hadoop - это единственная точка отказа. Как люди, имеющие большие кластеры...
Когда файлы передаются на узлы с использованием механизма распределенного кэша в потоковом задании...
Я использую PIG latin для обработки журналов, потому что это выражается в проблеме, когда данные...
Из этого руководства я успешно выполнил пример упражнения. Но при выполнении задания mapreduce я...
Я работаю над JsonStorage для Pig.Все работает нормально, но по крайней мере мне нужно получить...
У меня есть корзина s3, содержащая около 300 ГБ файлов журналов в произвольном порядке. Я хочу...
Я пытаюсь использовать Amazon Elastic Map Reduce для запуска серии симуляций нескольких миллионов...
Какие скрытые возможности Hadoop MapReduce должны знать все разработчики? Одна скрытая функция в...
Что такое параметр кворума zookeeper в hbase-site.xml?
Я собираю журналы с Flume для HDFS.Для тестового примера у меня есть небольшие файлы (~ 300 КБ),...