Я пытаюсь загрузить это в свиноводство, но мне трудно загрузить его в виде пяти различных полей.
Мой набор данных
QTM 2009,0.53,0.47,1365900
QTM 2009,0.56,0.54,1246100
QTM 2009,0.6,0.54,1023600
Если я попытаюсь загрузить это с помощью TextLoader, он будет читать строку как одно поле.
Я также попытался загрузить его как два поля, а затем с помощью команды STRSPLIT и затем объединить два. Проблема в том, что по умолчанию он объявляет его как bytearray. Я хочу иметь возможность выполнять агрегацию.
Для этого я использовал следующую команду:
A = Load 'NYSEB.txt' AS(Symbol:chararray, Detail:chararray);
B = Foreach A GENERATE (STRSPLIT(Symbol, ',',1)), (STRSPLIT(Detail, ',',
4));
B = Foreach A GENERATE
flatten(STRSPLIT (Symbol, ',',1)),
flatten(STRSPLIT(Detail, ',', 4));
Может кто-нибудь, пожалуйста, помогите мне: я хочу, чтобы мои поля были
(символ: строка, год: строка, оператор: double, cp: double, vol: int)