Я пытаюсь очистить URL с помощью Regex, но должно быть что-то, чего я не понимаю в Regex. Вот мой Regex
public static Regex newSite = new Regex("=['\"]https?://[A-Za-z0-9\\.]*(?<url>\\w+)\\.(?<ext>[A-Za-z]{2,3})(?<deep>.+)?[/?'\"]");
//...
MatchCollection newSites = newSite.Matches(input);
Согласно тому, что я прочитал, в группе <url>
жадный +
должен захватывать как можно больше символов. Таким образом, для ввода https://www.digitalocean.com
оно должно соответствовать digitalocean
. Мой Regex успешно совпал с вводом, но Match захватывает только последнюю букву n
. MatchCollection содержит
Groups->
Count 4:
[0]: https://www.digitalocean.com/assets/...
[1]: n
[2]: com
[3]: /assets/...
Как заставить группу захватить все?