Я недавно установил hadoop 2.8.4 на Windows 10 (псевдо режим).Я пытаюсь запустить программу...
Я вижу, как увеличивается размер входного файла. Неудачные тасования увеличиваются, а время...
Прежде всего, я очень новичок в MapReduce (фактически, только на этой неделе) и делаю это как часть...
Я пишу файлы Orc, используя формат MultipleOutputs, чтобы создать собственное имя файла.Я...
Я изучаю Spark и начинаю понимать, как Spark распределяет данные и объединяет результаты.Я пришел к...
Я командую %HADOOP_HOME%\bin\yarn jar...
У меня около 5 миллионов маленьких (800 КБ) файлов, которые хранятся в AWS S3.Я хочу объединить их...
Это должно быть довольно просто, и я потратил на это несколько часов. Пример данных (имя, двоичный...
У меня есть большая таблица Hive со столбцом Id, и я хочу разбить эту таблицу на несколько таблиц,...
Я написал программу преобразования карт, но редуктор не работает, ниже приведен код, который я...
Я делаю подсчет слов, поэтому маппер возвращает пары ключ и значение zz 1 zz 1 b 1 c 1 , и мой...
У меня есть JavaPairRDD с оценками, присвоенными несколькими пользователями для некоторых фильмов:...
Я хочу понять, что делать в следующем случае.Например, у меня есть 1 ТБ текстовых данных, и давайте...
Кажется, нехватка ресурсов из-за других запущенных заданий в той же очереди. Есть ли способ обойти...
на самом деле я новичок в среде hadoop и у меня много трудностей.Кто-нибудь может помочь в...
Я добавил эту строку в свой код, чтобы переопределить системные классы своими собственными: conf
Я пытаюсь запустить 2 программы на Python с помощью mapreduce и постоянно получаю сообщение об...
Я пытался conf.set("mapreduce.output.textoutputformat.separator","");, но это...
Я пытаюсь импортировать таблицу из MySQL через Sqoop Import Job, но моя работа не выполняется с...
В работе Map-Reduce я использую пять разных файлов, где в моем наборе данных содержатся значения в...
Я реализовал hadoop на 2 кластерах, но я не могу запустить TaskTracker & DataNode & jobTracker,...
Я запускаю программу wordcount на виртуальной машине Cloudera и получаю сообщение об ошибке ниже:...
Я запускаю программу подсчета слов. hadoop jar hadoop-mapreduce-examples-2.4.0.jar wordcount...
Я привык создавать MapReduce задания с использованием HBase таблиц в Hadoop+HBase. Я не работал...
У меня есть определенная функция: def map(id,txt): mapop= [] words = txt.split() for word in words:...