Хорошо, дай мне посмотреть, могу ли я разобрать это регулярное выражение для тебя.Я далеко не эксперт по использованию RegEx, но я уверен, что на этом сайте есть много людей, которые могут указать на мои недостатки с этим.
Выражение: ^https?://([a-zA-Z0-9\\-_]+)\\.(?:m\\.)?wikipedia\\.(?:com|org)/wiki/(.*)(?:\\?oldformat=true|\\?previous=yes)
^
символ, по существу имеющий его, проверяет, является ли это новой строкой или началом ввода
http
соответствие должно иметь это в нем
s?
соответствие может дополнительно иметь "s" в этой части
://
совпадение должно содержать это
(
начать создание группы для сохранения, чтобы позже ее можно было легко найти
[a-zA-Z0-9\\-_]
совпадение с большинством букв, цифр и специальныхсимволы
+
предыдущая определенная группа должна содержать один или несколько символов
)
маркер закрывающей группы
\\.
экранирование, необходимое для включения символа .
вmatch
(?:
создать группу, но не сохранять эту группу для справки позже
m\\.
match должно иметь "m".в нем
)
маркер закрывающей группы
?
предыдущая созданная группа является необязательной
wikipedia\\.
совпадение должно иметь "википедию".в нем
(?:
создать группу, но не сохранять эту группу для справки позже
com|org
совпадать с "com" или "org", они взаимозаменяемы
)
маркер закрывающейся группы
/wiki/
совпадение должно содержать "/ wiki /" в нем
(
создать группу, которая будет сохранена для справки позже
.
совпадение букв, цифр или специальных символов
*
включает ноль или более символов для предыдущего маркера
)
маркер закрывающей группы
(?:
создатьгруппа, но не сохраняйте ее
\\?
включают "?"в совпадении, что означает, что это будет проверять запросы, помещенные в URL
\\?oldformat=true|\\?previous=yes
, проверять, прикреплены ли запросы "? oldformat = true" или "? previous = yes"
)
маркер закрывающей группы
Я думаю, что это подводит итог.Если у вас есть еще вопросы по этому поводу, не стесняйтесь комментировать.Но суть в том, что match [1] собирается захватить группу ([a-zA-Z0-9\\-_]+)
, а match [2] собирается захватить группу (.*)
после части каталога /wiki/
.