Я использую карту упругости Amazon.
У меня есть файлы журналов, которые выглядят примерно так
random text foo="1" more random text foo="2"
more text notamatch="5" noise foo="1"
blah blah blah foo="1" blah blah foo="3" blah blah foo="4" ...
Как мне написать выражение «свинья», чтобы выбрать все числа в выражениях «foo»?
Я предпочитаю кортежи, которые выглядят примерно так:
(1,2)
(1)
(1,3,4)
Я пробовал следующее:
TUPLES = foreach LINES generate FLATTEN(EXTRACT(line,'foo="([0-9]+)"'));
Но это дает только первое совпадение в каждой строке:
(1)
(1)
(1)