У меня есть процесс, который перемещает файлы в папку обработки с помощью сценария pig в качестве...
Я новичок в Apache Pig и пытаюсь понять его архитектуру. Ссылка указана - https://www
У меня есть набор данных: (0,{(1),(2),(3),(6),(8),(9)}) (1,{(0),(5),(9)}) (2,{(0),(9)}) (3,{(0),(4)...
Я пытаюсь реализовать алгоритм «людей, которых вы, возможно, знаете» в Apache Pig, и я следую этой...
У меня есть две таблицы, и я хотел бы видеть общее количество клиентов и общее количество мужчин и...
Требуется помощь для чтения вложенных / многократных тегов xml с использованием XPath и XPathAll....
Я пытаюсь загрузить это в свиноводство, но мне трудно загрузить его в виде пяти различных полей....
Как получить доступ к скрытым файлам (файлам, которые начинаются с 'underscore' и 'dot') из...
Это код, который я запускаю: bigrams = LOAD 's3://******' AS (bigram:chararray, year:int,...
У меня есть данные временных рядов, например: 2018-10-12 01:25:37 и извлеченные дата (2018-10-12) и...
Предположим, у меня есть текстовое имя файла count.txt, которое содержит нижеупомянутый абзац I am...
Я пытаюсь проанализировать XML-файл, в котором теги находятся в итерации.поэтому, если конкретный...
У меня есть файл данных, который выглядит следующим образом: (id1, ['seller_name' # 'Ray'], {(A),...
Перед запуском Pig в режиме уменьшения карты вы всегда должны запустить сервер истории, в то время...
У меня есть Pig UDF (написанный на Java), который считывает данные из файла JSON, представленного в...
В настоящее время я работаю над анализом серии текстовых файлов, в которых каждое уникальное число...
Как мне использовать 2 для циклов в Apache Pig? У меня есть входные данные, как показано ниже: 1 a...
Я новичок в Apache Pig, и я не могу понять, как написать программу подсчета слов со следующими...
Ниже приведены подробности: date2.txt B02617,2/27/2015,1551,14677 B02598,2/27/2015,1114,10755...
У меня есть две переменные Pig: p , что составляет (id: int, companies: tuple(name:chararray)), и q...
Вот сценарий PIG, который я использую для чтения, фильтрации и сжатия данных в bzip2, но вместо
почему мы используем выражение group by all при использовании функции BagToString в pig ??? Это код...
У меня есть следующие четыре задачи, но я не совсем понимаю, как соединить два набора данных, чтобы...
Ниже приведен фрагмент кода, который я пытаюсь запустить, и столкнулся с проблемой недопустимого...
Caused by: org.apache.hadoop.ipc.RpcException: RPC response превышает максимальную длину данных at...