В моем наборе данных около 200000 тысяч строк. Используя приведенную ниже команду в PIG, я пытаюсь...
Возникают проблемы с преобразованием поля даты только в PIG. (Trump, Donald J.,VA,MARKETING...
Я новичок в pig и пытаюсь справиться с этим, и в настоящее время я пытаюсь объединить четыре...
У меня есть оператор свиньи, подобный этому: -- extract the 123 from `/id/123` interactions =...
У меня есть данные, заданные: GUIDEPSE = LOAD...
Я новичок в свиноводстве. Я не знаю, правильно ли я поступаю или нет, пожалуйста, помогите мне....
Предположим, что у нас есть файл с именем details.txt со следующими данными 421,Rajiv,Reddy,21...
Если вы внимательно изучите месячные наборы данных за 2013 год, вы увидите, что в каждой строке...
Предположим, что у меня есть два файла A.txt и B.txt. A.txt ID V1 V2 1 2.0 5.0 2 3.2 6.0 4 4.2 7.0...
Я хочу запустить сценарий оболочки на Dataproc, который будет выполнять мои сценарии Pig с...
Я новичок в Hadoop, пожалуйста, помогите 2019-10-07 18: 44: 46 563 [главная] ИНФОРМАЦИЯ org.apache
Мне нужно взять среднее значение третьего столбца, если первый и второй столбцы совпадают. Пример...
Я часами ломал голову над этим. Документы Pig говорят, что он использует регулярное выражение Java,...
Я запускаю скрипт pig pig. Окончательные данные задаются перенастроенным объектом S24: S24 =...
данные: 1 a 1 1 b 2 2 c 3 2 a 4 С помощью следующих команд: record = LOAD 'test_in' AS...
Я работаю над Apache Pig, чтобы получить представление о работе с большими базами данных.Конкретная...
Мне нужно оценить CD_MARCHE в соответствии со значениями CD_AXE_MCH для свиньи.Я должен...
У меня длинный ввод "20190503143744", и я хотел преобразовать его в формат "2019-09-06 11:46:22"...
Я хочу использовать карту в качестве ключа группировки в Pig Latin. Я пробовал следующие методы, но...
В Pig я пытаюсь заполнить значение поля, используя условие о другом поле. Я пытаюсь сделать что-то...
Я ищу решение в Apache Pig, включающее этот вывод: **id | email | phone | name** 123 dasd@qw...
Мне нужно создать объект DMS_EPRPFL, как показано этим сценарием pig: DMS_EPRPFL = FOREACH...
В таблице commit_time значение BIGINT и значение хранилища равно 20190508143744, когда я пытаюсь...
Я новичок в сценарии pig. Я пытаюсь загрузить определенную строку из файла, который имеет 1000...
Я пытаюсь использовать схему Avro для загрузки данных, находящихся на HDFS, используя сценарий Pig