// LINE 1
<td align="left" nowrap><font face="courier, monospace" size="-1"> (2002 GC1)</font></td>
// LINE 2
<td align="left" nowrap><font face="courier, monospace" size="-1"> 99942 Cocoon</font></td>
Я создал простое регулярное выражение, чтобы убрать немного нужных мне данных из строк HTML, приведенных выше, выражение работает хорошо и помещает нужные мне данные в две группы.
Шаблон регулярного выражения = ([0-9]+) ([A-Za-z0-9]+)
- LINE1: группа1 = 2002, группа2 = GC1
- LINE2: группа 1 = 99942, группа 2 = кокон
Пройдя по этим данным, я заметил, что есть новый тип строки HTML, в начале которой мне нужно получить дополнительное число.
// LINE 3
<td align="left" nowrap><font face="courier, monospace" size="-1">162421 (2000 CG70)</font></td>
- LINE3: группа 1 = 2000, группа 2 = CG70
То, что я пытаюсь сделать, - это изменить мой шаблон для дополнительного захвата 162421
, который соответствует тому же шаблону ([0-9]+)
, но, будучи новичком в регулярных выражениях, я не уверен, как добавить эту возможность в мой шаблон. Каждый раз, когда я пытаюсь это сделать, я либо отменяю уже работающий поиск, либо перезаписываю часть результата.
ПРИМЕЧАНИЕ. Я использую это с: NSRegularExpression на iOS.