Я работаю над сценарием Pig (мой первый), который загружает большой текстовый файл.Для каждой записи в этом текстовом файле содержимое одного поля необходимо отправить в службу RESTful для обработки.Ничего не нужно оценивать или фильтровать.Захватывайте данные, отправляйте их, и сценарию ничего не нужно возвращать.
Я предполагаю, что для такого рода функций требуется UDF, но я достаточно новичок в Pig, поэтому я неиметь четкое представление о том, что тип функции я должен построить.Моим лучшим предположением была бы функция хранения , поскольку данные в конечном итоге где-то сохраняются, но я чувствую, что количество предположений, связанных с приходом к такому выводу, выше, чем хотелось бы.* Любое понимание или руководство будет высоко ценится.