Предположим, у меня есть язык регулярных выражений, поддерживающий литералы, классы положительных и отрицательных символов, упорядоченное чередование, жадные квантификаторы ?
, *
и +
, а также несжатые квантификаторы ??
, *?
и+?
.(По сути, это подмножество PCRE без обратных ссылок, проверочных утверждений или некоторых других причудливых битов.) Уменьшает ли замена упорядоченного чередования неупорядоченным чередованием выразительную силу этого формализма?
(неупорядоченное чередование-- также иногда называемый «неупорядоченным выбором» --- таков, что L (S | T) = L (S) + L (T), в то время как упорядоченное чередование таково, что L (S | T) = L (S) +(L (T) - {a в L (T): a расширяет некоторый b в L (S)}). Конкретно, шаблон a|aa
будет соответствовать строкам a
и aa
, если чередование неупорядочено,но только a
, если чередование упорядочено.)
Другими словами, если шаблон S содержит упорядоченное чередование, можно ли переписать этот шаблон в эквивалентный шаблон T, который не содержит упорядоченных чередований (но, возможно, неупорядоченныхвместо чередования)?
Если бы этот вопрос был рассмотрен в литературе, я был бы признателен за любые ссылки, которые кто-либо может предоставить.Мне почти не удалось развернуть теоретическую работу о выразительной силе расширенных формализмов регулярных выражений (помимо обычных вещей о том, как обратные ссылки переводят вас из обычных языков в неконтекстные грамматики).