Использование apache pig и текста
hahahah. my brother just didnt do anything wrong. He cheated on a test? no way!
Я пытаюсь найти соответствие "мой брат просто не сделал ничего плохого".
В идеале я бы хотел сопоставить что-либо, начинающееся с «просто мой брат» и заканчиваться либо пунктуацией (конец предложения), либо EOL.
Глядя на документацию pig и затем переходя по ссылке на java.util.regex.Pattern, я полагаю, что смогу использовать
extrctd = FOREACH fltr GENERATE FLATTEN(EXTRACT(txt,'(my brother just .*\\p{Punct})')) as (txt:chararray);
Но это, кажется, совпадает до конца строки. Любые предложения для выполнения этого матча? Я готов вырвать мои волосы, и, потянув их за волосы, я имею в виду переключение на потоковую передачу питона