У меня есть следующий текст:
Example 1: 'lun et mer et mar'
Example 2: 'lun. et mer. - mar.'
Example 3: 'lun a ven'
Negative example 4 (must not match): 'sept à juin'
Negative example 5 (must not match): 'foo bar'
Negative example 6 (must not match): '9h30 - 18h'
Я пытаюсь сгруппировать каждое слово, поэтому желаемый результат будет таким:
Example 1: ['lun', 'et', 'mer', 'et', 'mar']
Example 2: ['lun', 'et', 'mer', '-', 'mar']
Example 3: ['lun', 'a', 'ven']
Регулярное выражение, которое я пробовал: здесь :
(?:((lun|mar|mer)\.?\s*(\-|au|a|à|et)?\s*)+)
Но в результате я получаю только последнее слово 'mar', дважды.
Я бы сказал, что у меня есть это проблема, но я попробовал то, что предложила статья, но безуспешно.
Кто-нибудь знает, как решить эту проблему?
ПРИМЕЧАНИЕ Мне нужно, чтобы это было регулярное выражениепотому что я анализирую неизвестный текст, и если есть полное совпадение, я знаю, с какими данными я имею дело.Например, это не должно совпадать:
Mustn't match: 'sept à juin'