Обратите внимание, что forward sla sh и da sh не являются метасимволами регулярных выражений, поэтому их не нужно экранировать, по крайней мере, в регулярных выражениях Presto. Рассмотрим эту версию:
select regexp_extract('sssshttps://jira.domain.com/browse/PR-6835hhhh',
'https.*?/browse/\w+-\d+')
Это должно вернуть:
https://jira.domain.com/browse/PR-6835
Ваше текущее регулярное выражение, похоже, исходит от другого языка, такого как JavaScript или PHP, где Литерал regex имеет разделитель /
, поэтому требуется экранирование /
.
Я только что отредактировал свой ответ, чтобы использовать ленивую точку .*?
при сопоставлении содержимого между https
и первым /browse
. Это должно исправить крайний случай, упомянутый в вашем комментарии, где .*
совпадает для нескольких URL.