Regex over EDI File - PullRequest
       45

Regex over EDI File

1 голос
/ 22 апреля 2020

Привет, ребята, у меня есть файл EDI, в котором есть некоторые строки с количеством, датой доставки и так далее. Теперь я хочу разделить его с помощью регулярных выражений, чтобы я разбил строки с необходимой информацией. Так что в приложении вы найдете содержимое файла. Я пробовал это с такими выражениями, как LIN +. * Или LIN +. *? ' но тогда я получаю только все сегменты LIN вместе или сегменты LIN, но с меньшим количеством информации. Я хочу разделить каждый элемент LIN всей информацией после него. Может ли кто-нибудь мне помочь?

UNB+UNOA:2+094200005561400986LA:ZZ+MTEL+200406:1436+34906++++1'UNH+112490+DELFOR:D:96A:UN'BGM+241+2004060008796+9'DTM+137:202004061436:203'DTM+157:20200406:102'DTM+36:20200206:102'NAD+BY+FRSFA0222838V::92'NAD+SE+000563X::92'UNS+D'NAD+CN+VP1::92++TEST+SK TEST:204 TEST:TEST 22:TEST ST TEST+++37540+FRA'LIN+1+3+441344:IN'PIA+1+7PK1150:VN'IMD+++:::VO-VKMV 7PK1150 VP'LOC+11+999'LOC+159+999'RFF+ON:P092303'QTY+113:100.00:PC'SCC+1'DTM+2:20200116:102'RFF+AAJ:P092303:100'QTY+113:100.00:PC'SCC+1'DTM+2:20200206:102'RFF+AAJ:P092304:100'LIN+2+3+502107:IN'PIA+1+3PK670:VN'IMD+++:::VO-VKMV 3PK670 EDC'LOC+11+999'LOC+159+999'RFF+ON:P088273'QTY+113:300.00:PC'SCC+1'DTM+2:20190503:102'RFF+AAJ:P088273:100'LIN+3+3+502109:IN'PIA+1+6PK970:VN'IMD+++:::VO-VKMV 6PK970 EDC'LOC+11+999'LOC+159+999'RFF+ON:P084470'QTY+113:200.00:PC'SCC+1'DTM+2:20190422:102'RFF+AAJ:P084470:100'LIN+4+3+6DK1215:IN'PIA+1+AVRRV50D1-VKMV 6DK1215:VN'IMD+++:::6DK1215'LOC+11+999'LOC+159+999'RFF+ON:P046369'QTY+48:533.00:PC'RFF+AAK:32299'DTM+171:20181109:102'QTY+113:533.00:PC'SCC+1'DTM+2:20190419:102'RFF+AAJ:P046369:100'LIN+5+3+6DK1320:IN'PIA+1+AVRRV50D1-VKMV 6DK1320?+282:VN'IMD+++:::6DK1320'LOC+11+999'LOC+159+999'RFF+ON:P061903'QTY+48:115.00:PC'RFF+AAK:43146'DTM+171:20181003:102'QTY+113:104.00:PC'SCC+1'DTM+2:20181005:102'RFF+AAJ:P061903:100'QTY+113:104.00:PC'SCC+1'DTM+2:20181102:102'RFF+AAJ:P062034:100'UNS+S'UNT+75+112490'UNZ+1+34906' ```

1 Ответ

0 голосов
/ 23 апреля 2020

Вы можете использовать

LIN(?:(?!LIN).)*

или гораздо более эффективную версию (следуя принципу unroll-the-l oop ):

LIN[^L]*(?:L(?!IN)[^L]*)*

См. regex demo # 1 и regex demo # 2

Шаблон (?:(?!LIN).)* закаленного жадного токена соответствует любому символу (. ) который не запускает последовательность символов LIN, 0 или более раз, но столько, сколько возможно.

Шаблон [^L]*(?:L(?!IN)[^L]*)* соответствует любым 0 или более символам, отличным от L, затем 0 или более вхождения последовательности L, за которой не следует IN, а затем 0+ символов, отличных от L.

...