Я считаю, что, если я уже зарегистрировал UDF из файла, выполнение REGISTER не перерегистрирует UDF...
У меня есть три значения A, B и C. Я хочу иметь возможность заменить значение C значением NULL,...
У меня есть сценарий, где у меня есть данные, как показано ниже: Customer ID | Customer Name |...
У меня возникли проблемы с выполнением операции SUM на NULLS в моем коде pig.Однако я не могу...
У меня есть набор данных с этими столбцами: - FMID,County,WIC,WICcash Вот пример данных: - 1002267...
Я не настраивал систему, над которой я сейчас работаю, поэтому я не знаю, какие настройки были...
Моя цель - подсчитать среднее количество загрузок для каждого пользователя в день.Набор данных...
У меня ниже данные в таблице. Archer late Patrick late Marie Walter late Michael-d'souza late...
My python udf возвращает список кортежей, подобный следующему: [(0.01, 12), (0.02, 6), (0.03, 12),...
Я столкнулся с проблемой при обработке типа данных для поля qty и выполнении SUM для того же поля
Мы обрабатываем 50 миллионов данных, и после обработки в конце мы используем функцию ранга в...
У меня есть строка json, где мне нужно извлечь массив....
Я использую Pig для чтения огромного файла CSV (+29000 строк), который выглядит следующим образом...
Команда Apache Pig Utility дает два одинаковых типа команд run и exec для выполнения сценария pig в...
Я пытаюсь загрузить файл паркета в виде свиньи. Одно из полей в файле имеет тип Timestamp. В pig,...
Я хочу объединить набор файлов avro в hdfs. Эти файлы находятся в каталогах / data / 20180823 / HH,...
Вот как выглядят данные: A: {id: int, data: {ARRAY_ELEM:(score:float, flag:boolean)}} 12, {(1.35,...
Я новичок в написании скриптов Pig. У меня есть следующие входные данные json...
Я пытаюсь извлечь строку из моих входных данных, такую как: I love [[cricket]]. Let's play...
Мне нужно запросить одну таблицу HIVE и отфильтровать другую таблицу с одним столбцом предыдущего....
Когда я даю команду ниже в командной строке, я получаю ошибку ниже. Команда: $pig -x mapreduce...
Я новичок в среде Hadoop и хотел бы объединить 4 CSV-файла в один файл. Все 4 CSV-файла имеют...
Когда я пытаюсь запустить команды pig в grunt shell, это работает.Однако, когда я пытаюсь запустить...
Я использую функцию Over из Piggybank, чтобы получить отставание строки res= foreach (group table...
Я пытался выполнить следующий код на сценарии Pig: %declare OLD_YEARS `echo $(for i in $(seq 0 3);...