Я хочу использовать встроенный метод REGEX_EXTRACT и REGEX_EXTRACT_ALL методы Pig. Какую банку я...
У меня есть несколько строк журнала данных, таких как Sep 10 12:00:01 10.100.2.28 t: |US,en,5,7350...
У меня есть файл со строками в следующем формате 1 2 3 4,5,6 Первые три, разделенные пробелом, и...
Предполагая, что у меня есть строки данных, подобные приведенным ниже, которые показывают имена...
Я тестирую hadoop pig на небольшом кластере. Я успешно использую pig для потоковой передачи perl,...
У меня ежедневно создается папка с файлами, в которых хранится информация одного типа.Я хотел бы...
Итак, я видел несколько обучающих программ для этого онлайн, но каждый, кажется, говорит что-то...
Кажется, это очень распространенный вариант использования, но его трудно реализовать в Hadoop (это...
Я собираюсь начать играть с PIG-латиницей, и я надеялся получить некоторую подсветку текста и тому...
Один из столбцов в моем отношении содержит значения с разделителями (например, csv), и я хочу...
PIG поддерживает предложение IN? filtered = FILTER bba BY reason not in ('a'...
Мне нужно «транспонировать» данные, которые выглядят следующим образом: id City 111 Chicago 111 New...
У меня есть кластер cassandra с именем пользователя и паролем, установленными в файле password
Я пытаюсь выполнить некоторую обработку журналов, используя Apache Pig Latin, и мне было интересно,...
Попытка присоединиться к одному набору, который имеет количество дней в месяце с набором данных на...
Мне нужно последовательно запускать некоторые сценарии Pig в Hadoop. Они должны быть запущены...
Я установил виртуальную машину с Ubuntu. Он запускает hadoop как один узел. Позже я установил на...
Кто-нибудь знает, как вызвать Perl-скрипт из сценария PIG. Также я хочу знать, как вызывать...
просто интересно, что означает следующая команда? так трудно гуглить темы, связанные со свиньей:...
У меня есть файл данных в следующем формате: U: john T: 2011-03-03 12:12:12 L: san diego, CA U:...
У меня есть список имен и чисел для мужчин и женщин. Похоже на это ABEL 32898 82 CALLAN 1087 868...
У меня есть mysqldump формата: INSERT INTO `MY_TABLE` VALUES (893024968,'342903068923468'...
Я хочу эффективно отсортировать большой набор данных (то есть с пользовательским разделителем, как...
Извиняюсь, если этот вопрос сформулирован плохо: я начинаю крупномасштабный проект машинного...
Я запустил сценарий pig на кластере hadoop, он прошел успешно, но я не могу найти файлы результатов...