После того, как я установил Hadoop, я установил Pig.Однако у меня возникают следующие проблемы:...
Мне нужно вычеркнуть третье и последующие значения в компоненте «в скобках» строки...
У меня два поросенка.Первый count_pairs показывает пары слов и сколько раз их видели.напр. ((car...
Работа с pigtmp $ pig --version Apache Pig версии 0.8.1-cdh3u1 (rexported) скомпилирован 18 июля...
Я использовал AWSSDKforPHP, чтобы запустить экземпляр emr для запуска сценариев pig и вывести его...
Я загружаю файл в PIG.После разделения записей с помощью STRSPLIT(doc,',') я бы хотел...
Я пытаюсь использовать функцию TOKENIZE в PIG для документа, разделенного запятой.Я хотел бы...
Я очень новичок в PIG, и у меня возникло ощущение основной проблемы. У меня есть строка кода,...
Есть учетная запись ids, каждый с timestamp, сгруппированным по username.для каждого из этих групп...
A = load 'a.txt' as (id, a1); B = load 'b.txt as (id, b1); C = join A by id, B by id;...
Я делаю внешние соединения на отдельных столбцах в Pig, как это result = JOIN A by id LEFT OUTER, B...
(Еще более простой, чем Разница между Pig и Hive? Почему есть и то и другое? ) У меня есть конвейер...
У меня есть два файла данных: range.txt Min Max Name 1 10 a 11 20 b 21 30 c 31 100 d 101 200 e и...
Я использую Pig (0.9.1) с UDF, написанными на Python. Скрипты Python импортируют модули из...
У меня есть два файла, один называется a-records 123^record1 222^record2 333^record3 и другой файл...
Это может быть действительно глупый вопрос, но я не могу правильно установить pig на моей машине....
В PigLatin я хочу извлечь другие поля из записи, которую я хочу выбрать из-за совокупности, такой...
Я понимаю, что Pig Latin - это язык потоков данных. В этом смысле теоретически должно быть возможно...
Я хочу, чтобы какой-то уникальный идентификатор / номер_строки / счетчик был сгенерирован /...
Предположим, у меня есть входной файл input.dat, который выглядит следующим образом: apples 10...
У меня есть файл в формате hdf с 100 столбцами, который я хочу обработать, используя pig. Я хочу...
Есть ли какие-либо преимущества (в сравнении с производительностью / отсутствием карты), когда я...
Мне интересно: поскольку стандартное поведение реляционного оператора SPLIT в PIG заключается в...
Я хочу встроить скрипт Python в Python, но мне нужно передать несколько параметров скрипту Python,...
У меня есть свиная работа, где мне нужно отфильтровать данные, найдя в них слово, Вот фрагмент A =...