Как проверить, что URL действителен в Java 1.6? - PullRequest
4 голосов
/ 29 июня 2010

Мое приложение обрабатывает URL-адреса, введенные пользователями вручную.Я обнаружил, что некоторые некорректные URL-адреса (например, http: / not-valid) приводят к исключению NullPointerException, возникающему при открытии соединения.Как я узнал из этого отчета об ошибках Java , проблема известна и не будет исправлена.Предлагаем использовать java.net.URI, который «более соответствует RFC 2396».

Вопрос: как использовать URI для решения проблемы?Единственное, что я могу сделать с URI - это использовать его для разбора строки и генерации URL.Я подготовил следующую программу:

import java.net.*;

public class Test
{
    public static void main(String[] args)
    {
       try {
           URI uri = URI.create(args[0]);
           Object o = uri.toURL().getContent(); // try to get content
       }
       catch(Throwable e) {
           e.printStackTrace();
       }
    }
}

Вот результаты моих тестов (с Java 1.6.0_20), мало чем отличающихся от того, что я получаю с java.net.URL:

sh-3.2$ java Test url-not-valid
java.lang.IllegalArgumentException: URI is not absolute
        at java.net.URI.toURL(URI.java:1080)
        at Test.main(Test.java:9)
sh-3.2$ java Test http:/url-not-valid
java.lang.NullPointerException
        at sun.net.www.ParseUtil.toURI(ParseUtil.java:261)
        at sun.net.www.protocol.http.HttpURLConnection.plainConnect(HttpURLConnection.java:795)
        at sun.net.www.protocol.http.HttpURLConnection.connect(HttpURLConnection.java:726)
        at sun.net.www.protocol.http.HttpURLConnection.getInputStream(HttpURLConnection.java:1049)
        at java.net.URLConnection.getContent(URLConnection.java:688)
        at java.net.URL.getContent(URL.java:1024)
        at Test.main(Test.java:9)
sh-3.2$ java Test http:///url-not-valid
java.lang.IllegalArgumentException: protocol = http host = null
        at sun.net.spi.DefaultProxySelector.select(DefaultProxySelector.java:151)
        at sun.net.www.protocol.http.HttpURLConnection.plainConnect(HttpURLConnection.java:796)
        at sun.net.www.protocol.http.HttpURLConnection.connect(HttpURLConnection.java:726)
        at sun.net.www.protocol.http.HttpURLConnection.getInputStream(HttpURLConnection.java:1049)
        at java.net.URLConnection.getContent(URLConnection.java:688)
        at java.net.URL.getContent(URL.java:1024)
        at Test.main(Test.java:9)
sh-3.2$ java Test http:////url-not-valid
java.lang.NullPointerException
        at sun.net.www.ParseUtil.toURI(ParseUtil.java:261)
        at sun.net.www.protocol.http.HttpURLConnection.plainConnect(HttpURLConnection.java:795)
        at sun.net.www.protocol.http.HttpURLConnection.connect(HttpURLConnection.java:726)
        at sun.net.www.protocol.http.HttpURLConnection.getInputStream(HttpURLConnection.java:1049)
        at java.net.URLConnection.getContent(URLConnection.java:688)
        at java.net.URL.getContent(URL.java:1024)
        at Test.main(Test.java:9)

Ответы [ 3 ]

1 голос
/ 29 июня 2010

Вы можете использовать appache Validator Commons ..

UrlValidator urlValidator = new UrlValidator();
urlValidator.isValid("http://google.com");

http://commons.apache.org/validator/

http://commons.apache.org/validator/api-1.3.1/

1 голос
/ 29 июня 2010

Если я запускаю ваш код с типом неверно сформированного URI в отчете об ошибке , он вызывает исключение URISyntaxException. Таким образом, предлагаемое исправление исправляет сообщенную ошибку.

$ java -cp bin UriTest http:\\\\www.google.com\\
java.lang.IllegalArgumentException
    at java.net.URI.create(URI.java:842)
    at UriTest.main(UriTest.java:8)
Caused by: java.net.URISyntaxException: Illegal character in opaque part at index 5: http:\\www.google.com\
    at java.net.URI$Parser.fail(URI.java:2809)
    at java.net.URI$Parser.checkChars(URI.java:2982)
    at java.net.URI$Parser.parse(URI.java:3019)
    at java.net.URI.(URI.java:578)
    at java.net.URI.create(URI.java:840)

Ваш тип некорректного URI отличается и не является синтаксической ошибкой.

Вместо этого перехватите исключение нулевого указателя и восстановите с помощью подходящего сообщения.

Вы можете попытаться проявить дружелюбие и проверить, начинается ли URI с одной косой черты "http: /", и предложить это пользователю, или проверить, не является ли имя хоста URL-адреса не пустым:

import java.net.*;

public class UriTest
{
    public static void main ( String[] args )
    {
        try {
            URI uri = URI.create ( args[0] );

            // avoid null pointer exception
            if ( uri.getHost() == null )
                throw new MalformedURLException ( "no hostname" );

            URL url = uri.toURL();
            URLConnection s = url.openConnection();

            s.getInputStream();
        } catch ( Throwable e ) {
            e.printStackTrace();
        }
    }
}
0 голосов
/ 18 марта 2014

Обратите внимание, что даже при подходах, предложенных в других ответах, вы не получите правильное подтверждение, так как java.net.URI соответствует RFC 2396, который заметно устарел.Используя java.net.URI, вы получите исключения для URL-адресов, которые сегодня действительны для всех веб-браузеров.

Чтобы решить эти проблемы, я написал библиотеку для анализа URL-адресов в Java: galimatias .Он выполняет синтаксический анализ URL так же, как и веб-браузеры (придерживаясь спецификации WHATWG ).

В вашем случае вы можете написать:

try {
    URL url = io.mola.galimatias.URL.parse(url).toJavaURL();
} catch (GalimatiasParseException e) {
    // If this exception is thrown, the given URL contains a unrecoverable error. That is, it's completely invalid.
}

Какхороший побочный эффект, вы получаете много санитарной обработки, которую вы не получите с java.net.URI.Например, http:/example.com будет правильно проанализирован как http://example.com/.

...