У меня есть следующий текст в следующем формате, но я хочу выбрать и сгруппировать слова в начале из 12 найденных цифр и остановиться в начале следующих 12 цифр, которые также должны быть сгруппированы вместе.
Например, в моем тексте ниже следует сгруппировать следующее:
011111111111 CDGH, LGF ADF: 203 HYT LOREM IPSUM / LOREM IPSUM COUNTY: GTYH CHIDGERL. IPSUM THJ. ДАТА: 21.07.2000 LOREM IPSUM DOLOT & LOREM IPSUM 768 LOREM IPSUM, 67-й LOREM IPSUM IPSUM. DTEA: NIGER, GA 12345 LOREM IPSUM DOLOT 97 LOREM IPSUM
DOLOT, KY 35678-8765
А также
0222222222222 CDGH, LGF ADF: 203 HYT LOREM IPSUM / LOREM IPSUM СТРАНА: GTYH johjk L. IPSUM THJ. ДАТА: 21.07.2000 LOREM IPSUM DOLOT & LOREM IPSUM 768 LOREM IPSUM, 67-й LOREM IPSUM IPSUM. DTEA: NIGER, GA 12345 LOREM IPSUM DOLOT 97 LOREM IPSUM
DOLOT, KY 35678-8765
Это образец всего документа
LOREM IPSUM LORIPSUM DDDDDDDDD FG SSSSS НОМЕР
106/03/2019 LOREMFG GH LOREMIPSUMF
LOREM OPFRTE ERTIO
LOREMIPS LOREMIOS 30/05/2019 DERTE TH LOREM (LWA LTD) ------------------------------------------------------------------------------------------------------------------------------------ 011111111111 CDGH, LGF ADF: 203 HYT LOREM IPSUM / LOREM IPSUM ОКРУГ: GTYH CHIDGER L. IPSUM THJ. ДАТА: 21.07.2000 LOREM IPSUM DOLOT & LOREM IPSUM 768 LOREM IPSUM, 67-й LOREM IPSUM IPSUM. DTEA:
NIGER, GA 12345 LOREM IPSUM DOLOT
97 LOREM IPSUM DOLOT, KY 35678-8765 0222222222222 CDGH, LGF ADF: 203 HYT LOREM IPSUM / LOREM IPSUM КОЛИЧЕСТВО: ГРИЙ ЛЖИTHJ. ДАТА: 21.07.2000 LOREM IPSUM DOLOT & LOREM IPSUM 768 LOREM IPSUM, 67-й LOREM IPSUM IPSUM. DTEA:
NIGER, GA 12345 LOREM IPSUM DOLOT
97 LOREM IPSUM DOLOT, KY 35678-8765 011111111111
CDGH, LGF АПД: 203 HYT LOREM IPSUM / LOREM IPSUM ЧУНГL. IPSUM THJ. ДАТА: 21.07.2000 LOREM IPSUM DOLOT & LOREM IPSUM 768 LOREM IPSUM, 67-й LOREM IPSUM IPSUM. DTEA:
NIGER, GA 12345 LOREM IPSUM DOLOT
97 LOREM IPSUM DOLOT, KY 35678-8765
Код, который я написал, выбирает только 12 цифр и пробел, но игнорирует текстмежду этим. Ссылка на regex101, которую я написал для этой цели
(\b\d{12}\s*\b[A-Za-z0-9_.]*+\s+)