Попытка получить только URL из вывода в Java - PullRequest
0 голосов
/ 19 февраля 2011

Я новичок в Java и ищу решение ... возможно, я не ищу правильную терминологию.

Моя цель: у меня есть класс Java, который использует веб-драйвер для перехода на страницу, поиска ... и вывода результатов. Выходные результаты имеют простой текст с URL-адресами. Все, что меня волнует, это возвращенный URL. В общем, я хочу взять мой вывод как:

Результат поиска 1 http://www.somesite.com/blahblah это это сайт из результатов поиска.

но все, что мне нужно, это URL, я хочу вывести остальную часть вывода. Я посмотрел в "разборе в Java", но не нашел то, что я ищу. Любые указатели будут высоко оценены.

Ответы [ 2 ]

3 голосов
/ 19 февраля 2011
Pattern pattern = Pattern.compile("http://[^\\s]*");
Matcher matcher = pattern
    .matcher("Search result 1 http://www.somesite.com/blahbl+ah1 this is a site from the search results.\nSearch result 1 http://www.somesite.com/blahblah2 this is a site from the search results.");

for (int begin = 0; matcher.find(begin); begin = matcher.end())
{
    System.out.println(matcher.group(0));
}
1 голос
/ 19 февраля 2011

Проверьте пакет регулярных выражений: http://download.oracle.com/javase/1.4.2/docs/api/java/util/regex/package-summary.html

Конечно, есть и другие способы анализа, но использование маршрута регулярных выражений, вероятно, является самым чистым.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...