У меня есть объект пользовательской модели с несколькими полями (если хотите, свойствами). Скажите...
Я хочу разработать веб-сайт, который позволит аналитикам внутри компании запускать задания Hadoop...
Мой класс редуктора производит выходные данные с TextOutputFormat (OutputFormat по умолчанию,...
Я пытаюсь объединить несколько файлов в нескольких входных каталогах в один файл, по разным...
Я экспериментировал с Hive для некоторых операций по извлечению данных и хотел бы сделать его легко...
Я хочу расширить существующий алгоритм кластеризации, чтобы справиться с очень большими наборами...
Я очень плохо знаком с MapReduce и завершил пример подсчета слов в Hadoop. В этом примере он...
У меня есть пользовательская функция (UDF), написанная на Java для анализа строк в файле журнала и...
Я пытаюсь заставить работать плагин eclipse для разработки hadoop, я использую hadoop 0.18.3. Я...
Я хочу сделать довольно грубую обработку грубой силы для сопоставления строк. Я запустил свой...
Мне нужны идеи для проекта выходного дня о Hadoop и OpenStreetMap. У меня есть доступ к экземпляру...
Я хочу написать работу карты / сокращения, чтобы выбрать количество случайных выборок из большого...
Для разработки приложений hadoop PHP-платформы менее популярны? Если да, то почему? Иначе,...
Во многих реальных ситуациях, когда вы применяете MapReduce, окончательные алгоритмы заканчиваются...
Я знаю, как работает memcached. Как работает Hadoop?
согласно проекту Apache AVRO, «Avro - система сериализации».Говоря о системе сериализации данных,...
Я прочитал некоторую документацию о hadoop и увидел впечатляющие результаты. Я получаю более...
Как я могу обработать несколько соединений с хостом одновременно?
Map Reduce - шаблон, который в последнее время, похоже, набирает обороты, и я начинаю видеть, что...
У меня проблема с выполнением байесовского алгоритма в Mahout. Я создал его с помощью Maven, и файл...
Apache Pig может загружать данные из файлов последовательности Hadoop, используя PiggyBank...
Я изучил алгоритм mapreduce и как он может потенциально масштабироваться до миллионов машин, но я...
Мне нужно хранить большое количество небольших объектов данных (миллионы строк в месяц). Как только...
Я хотел бы начать думать о том, как я могу расширить свои алгоритмы, которые я пишу для анализа...
Я смотрю на использование системы MapReduce для обслуживания веб-страниц, и я видел, что...