Как можно проанализировать URL-адреса из любого простого текста (не ограничиваясь атрибутами href в тегах)?
Будут оценены любые примеры кода на Python.
Вы можете использовать Регулярное выражение для анализа строки.
Посмотрите на этот ранее заданный вопрос: Какой самый чистый способ извлечь URL из строки с помощью Python?
См. Блог Яна Гойваэрта .
Так что пример кода Python может выглядеть как
result = re.findall(r"\b(?:(?:https?|ftp|file)://|www\.|ftp\.)[-A-Z0-9+&@#/%=~_|$?!:,.]*[A-Z0-9+&@#/%=~_|$]", subject)