Я не понимаю, почему matcher.find () всегда возвращает false - PullRequest
0 голосов
/ 01 мая 2019

Моя страница String содержит эту страницу http://www.posh24.se/kandisar, и я хочу извлечь все между

<div class="channelListEntry"> 

и

</div>

и поместить результат в ArrayList.

Дело в том, что matcher.find() всегда возвращает false.

private ArrayList<String> extracted = new ArrayList<String>();

    public void extractChannel(String htmlPage){

    Pattern pattern = Pattern.compile("<div class=\"channelListEntry\">(.*?)</div>");
    Matcher matcher = pattern.matcher(htmlPage);

    while(matcher.find()){ // Always return false
        System.out.println("hello ?");
        extracted.add(matcher.group(1));
    }
}

Я ожидаю скопировать текст между тегами в моем массиве.

1 Ответ

0 голосов
/ 01 мая 2019

Добавить флаг Pattern.DOTALL при компиляции шаблона, чтобы он соответствовал многострочным линиям - https://stackoverflow.com/a/2913756/9335036

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...