Ответ - нет. Данные должны быть в кластере на узлах данных, прежде чем какое-либо задание MR может даже выполнить данные.
Однако, если вы используете небольшую выборку данных и просто хотите сделать что-то простое, вы можете использовать Pig в локальном режиме и просто записать stdin в локальный файл и запустить его через свой скрипт.
Но больший вопрос возникает, почему вы хотите использовать MR / Pig для потока данных? Это было и не предназначено для этого типа использования.