Извините за несколько бесполезный заголовок, мне очень трудно объяснить эту проблему.
У меня есть список уникальных идентификаторов, которые могут появляться разными способами, и я пытаюсь использовать регулярные выражения для их нормализации, чтобы я мог сравнить несколько баз данных. Вот несколько примеров из них:
AB1201
AB-1201
AB1201-T
AB-12-01L1
AB1201-TER
AB1201 Transit
Я написал строку кода, которая вытаскивает все знаки и пробелы, и использовал это регулярное выражение:
([a-zA-Z]{2}[\d]{4})(L\d|Transit|T$)?
Это работает точно как и ожидалось, возвращает список, похожий на этот:
AB1201
AB1201
AB1201T
AB1201L1
AB1201
AB1201T
Проблема в том, что у меня есть один идентификатор, который выглядит так: AB1201-02
. Мне нужно, чтобы это поднималось как исключение, а не как совпадение.
Есть идеи? Я рад предоставить дополнительные разъяснения, если это необходимо. Спасибо!
От онлайн-тестера Regex101