Старая тема, но я думаю, что мои поправки могут быть полезны для кого-то еще, приземляющегося здесь:
Я не хотел проверять только «www» в качестве имени хоста, в настоящее время мы можем встретить разные имена хостов ... Таким образом, я расширил Regex с помощью:
"((?:http|https)://)?(?:[A-Za-z0-9]{1,25}\\.)?[\\w\\d\\-_]+\\.\\w{2,3}(\\.\\w{2})?(/(?<=/)(?:[\\w\\d\\-./_]+)?)?"