Я пытаюсь использовать regex_extract, чтобы получить все после # из твита.Я использую этот код, но я продолжаю получать ничего, без ошибок, просто пустое место, где я должен получить выдержку из твита, что я делаю не так?
grunt> a = load '/user/manuelrivera11828510/lab/pig/full_text.txt' AS (id:chararray, ts:chararray, location:chararray, lat:float, lon:float,
tweet:chararray);
grunt> b = foreach a generate id, ts, (lat, lon) as location, REGEX_EXTRACT(tweet, '(.*)#(\\s{8})([:| ])(.*)',2) as hash;
Это то, что я получаю (пример):
(USER_8f811b71,2010-03-06T16:12:59,(40.722733,-73.5367),)
Спасибо,