Я согласен, что синтаксис регулярных выражений с шумом строки является большой проблемой, и, честно говоря, я не понимаю, почему так много людей принимают или защищают его, он не читается человеком.
Что-то, что вы не упоминаете в своем посте, но что почти так же плохо, это то, что почти каждый язык, редактор или инструмент имеют свои собственные вариации синтаксиса регулярных выражений. Некоторые из них поддерживают синтаксис POSIX, как он был определен много лет назад, некоторые поддерживают синтаксис Perl, как сегодня. Но у многих есть свои собственные независимые способы выражения вещей, или какие символы являются «специальными» (специальные символы - другая тема), а какие нет. Что сбежало, а что нет. И т. Д. Не только трудно прочитать регулярное выражение, написанное для одного языка или инструмента, но даже если вы полностью запомните правила синтаксиса для вашего любимого варианта, они могут сбить вас с толку на другом языке, где {2,3} больше не нужно означает то, что вы ожидаете. Это действительно беспорядок.
Кроме того, я думаю, что многие непрограммисты, которые (если бы они знали, что он существует), были бы рады иметь язык сопоставления с образцом, который они могли бы использовать в повседневных инструментах, таких как Google или Microsoft Word. Но для этого должен быть более простой синтаксис.
Итак, чтобы ответить на ваш вопрос, я часто думал о создании какой-нибудь кроссплатформенной, кросс-языковой, кросс-универсальной библиотеки, которая позволила бы вам «переводить» из любого синтаксиса регулярных выражений (будь то Perl или POSIX). или Emacs и т. д.) в любой другой синтаксис регулярных выражений. Чтобы вам не пришлось беспокоиться о том, может ли регулярное выражение Python выполнять отрицательный просмотр, или если скобки класса символов следует экранировать в регулярном выражении Emacs. Вы можете просто запомнить один синтаксис, а затем выполнить вызов функции, чтобы получить эквивалентный синтаксис для всего, что вы использовали.
Оттуда он может быть расширен новым языком сопоставления с образцом, который будет немного более многословным или, по крайней мере, более мнемоническим. Что-то для людей, которые не хотят тратить полчаса на изучение регулярного выражения, чтобы понять, что оно делает. (И люди, которые думают, что регулярные выражения хороши, поскольку им, очевидно, никогда не приходилось поддерживать то, что они не написали сами, или они понимали бы необходимость того, чтобы другие люди могли анализировать то, что они написали.)
Буду ли я когда-нибудь покушаться на такого зверя? Я не знаю, это было в моем списке дел в течение долгого времени, и там также есть много более простых и интересных проектов. Но если вы рассматриваете нечто подобное, дайте мне знать.