Я очень новичок в PIG, и у меня возникло ощущение основной проблемы.
У меня есть строка кода, которая гласит:
A = load 'Sites/trial_clustering/shortdocs/*'
AS (word1:chararray, word2:chararray, word3:chararray, word4:chararray);
где каждый файл представляет собой строку из 4 слов, разделенных запятыми. Однако PIG не разделяет это на 4 слова. Когда я делаю сброс A
, я получаю: (Money, coins, loans, debt,,,)
Я пробовал поискать в Google, и я не могу найти, в каком формате должен быть мой файл, чтобы PIG правильно его интерпретировал. Пожалуйста, помогите!