Проверка URL - сложная задача. Это также очень широкий запрос.
Что именно вы хотите сделать? Вы хотите проверить формат URL, существование или что? Есть несколько возможностей, в зависимости от того, что вы хотите сделать.
Регулярное выражение может проверять формат URL. Но даже сложное регулярное выражение не может гарантировать, что вы имеете дело с действительным URL.
Например, если вы берете простое регулярное выражение, оно, вероятно, отклонит следующий хост
http://invalid##host.com
но это позволит
http://invalid-host.foo
это действительный хост, но не действительный домен, если вы рассматриваете существующие TLD. Действительно, решение будет работать, если вы хотите проверить имя хоста, а не домен, потому что следующее является допустимым именем хоста
http://host.foo
а также следующий
http://localhost
Теперь позвольте мне дать вам несколько решений.
Если вы хотите проверить домен, то вам нужно забыть о регулярных выражениях. Наилучшее решение, доступное на данный момент, - Public Suffix List, список, поддерживаемый Mozilla. Я создал библиотеку Ruby для анализа и проверки доменов по общему списку суффиксов, и она называется PublicSuffix .
Если вы хотите проверить формат URI / URL, вы можете использовать регулярные выражения. Вместо того, чтобы искать один, используйте встроенный метод Ruby URI.parse
.
require 'uri'
def valid_url?(uri)
uri = URI.parse(uri) && !uri.host.nil?
rescue URI::InvalidURIError
false
end
Вы даже можете решить сделать это более ограничительным. Например, если вы хотите, чтобы URL был URL-адресом HTTP / HTTPS, вы можете сделать проверку более точной.
require 'uri'
def valid_url?(url)
uri = URI.parse(url)
uri.is_a?(URI::HTTP) && !uri.host.nil?
rescue URI::InvalidURIError
false
end
Конечно, есть множество улучшений, которые вы можете применить к этому методу, включая проверку пути или схемы.
И последнее, но не менее важное: вы также можете упаковать этот код в валидатор:
class HttpUrlValidator < ActiveModel::EachValidator
def self.compliant?(value)
uri = URI.parse(value)
uri.is_a?(URI::HTTP) && !uri.host.nil?
rescue URI::InvalidURIError
false
end
def validate_each(record, attribute, value)
unless value.present? && self.class.compliant?(value)
record.errors.add(attribute, "is not a valid HTTP URL")
end
end
end
# in the model
validates :example_attribute, http_url: true