ch = LOAD 'ch.txt'; ch_all = GROUP ch ALL; ch_count = FOREACH ch_all GENERATE COUNT(ch);...
Я хочу заказать кортежи, используя мой собственный класс компаратора.Если я выполню запрос типа «B...
Я использую pig CassandraStroage () для вставки большого набора данных в cassandra, после 4 часов...
У меня есть запрос в SQL, который я пытаюсь перевести на Pig Latin (для использования в кластере...
Я хочу иметь возможность сделать стандартный diff для двух больших файлов. У меня есть кое-что, что...
Я расширяю LoadFunc. В функции getNext я хотел бы пропустить возврат кортежа при определенных...
Как я уже заметил , Pig плохо справляется с пустыми (0-байтовыми) файлами. К сожалению, существует...
Я хотел бы знать, как выполнять запросы Pig, хранящиеся в формате Hive.Я настроил Hive для хранения...
Наш рабочий процесс использует кластер упругого преобразования AWS для запуска серии заданий Pig...
мне нужно загрузить файл в формате pig, имеющий длинное и сложное имя:...
У меня два отношения: DUMP A: (1) (4) (2) DUMP B: (item12) (item2) (item32) как я могу объединить...
У меня есть схема, описывающая значения tf-idf для слов в различных статьях.Его описание выглядит...
у меня есть такой кортеж: ((item114,),1) ((item32,item31,),1) ((item81,item27,),2) последнее число...
У меня есть следующий кортеж H1, и я хочу strsplit его $ 0 в кортеж. Однако я всегда получаю...
У меня есть простой скрипт на python (moo.py), который я пытаюсь транслировать, хотя import sys, os...
Привет всем, что я выполнил здесь: http://wiki.apache.org/pig/PiggyBank, чтобы построить банку с...
У меня есть требование, когда у меня есть большие наборы входящих данных в систему, которой я...
как передать значение в качестве аргументов командной строки в сценарии PIG Cassandra. Под строкой...
Нам нужно, как часть нашего продукта для запуска, вычислить «аналогичную пользовательскую функцию»
Я пытаюсь проанализировать файлы данных, разделенные табуляцией, сгенерированные нашими сервисами с...
Мы храним наши журналы на S3, и один из наших запросов (Pig) будет захватывать три разных типа...
У меня есть этот файл, содержащий список данных в Hadoop. Я создал простой скрипт Pig, который...
У меня есть набор записей, которые я загружаю из файла, и первое, что мне нужно сделать, это...
Я новичок в PIG и Hadoop.Я написал UDF PIG, который работает со строкой и возвращает строку.Я на...
У меня есть много файлов журнала gzip'd в s3, который имеет 3 типа строк журнала: b, c, i.i и c оба...