Java регулярное выражение, чтобы найти фразы из 2 слов - PullRequest
3 голосов
/ 22 ноября 2011

У меня большой текстовый файл.Я пытаюсь найти все фразы (любые 2 последовательности слов).Подойдет ли приведенное ниже регулярное выражение?

Pattern p = Pattern.compile("\w+\s{1}\w+");

Я пробовал, но он не работает.

Ответы [ 2 ]

4 голосов
/ 22 ноября 2011

Следующее должно работать. Тебе нужно убежать от косой черты.

Pattern p = Pattern.compile("\\w+\\s{1}\\w+");

Проверьте секцию «escape-последовательности» здесь .

0 голосов
/ 22 ноября 2011

Ваш RegEx должен работать. Вот пример реализации в Java:

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Main {
    public static void main(String[] args) {
        String html = "ed ut perspiciatis, unde omnis iste natus error! sit 'voluptatem' " +
                "accusantium doloremque laudantium, totam rem aperiam, eaque ipsa quae ab illo " +
                "inventore veritatis et quasi architecto beatae vitae dicta sunt explicabo. " +
                "Nemo enim ipsam voluptatem quia voluptas sit aspernatur aut odit aut fugit, " +
                "sed quia consequuntur magni dolores eos qui ratione voluptatem sequi nesciunt." +
                " Neque porro quisquam est, qui dolorem ipsum quia dolor sit amet, consectetur, " +
                "adipisci velit, sed quia non numquam eius modi tempora incidunt ut labore et " +
                "dolore magnam aliquam quaerat voluptatem. Ut enim ad minima veniam, quis " +
                "nostrum exercitationem ullam corporis suscipit laboriosam, nisi ut aliquid " +
                "ex ea commodi consequatur? Quis autem vel eum iure reprehenderit qui in ea " +
                "voluptate velit esse quam nihil molestiae consequatur, vel illum qui dolorem " +
                "eum fugiat quo voluptas nulla pariatur?";
        Pattern p = Pattern.compile("\\w+\\s\\w+");
        Matcher m = p.matcher(html);
        while (m.find()) {
            System.out.println(m.group());
        }
    }
}

Дает этот (отрезанный) вывод:

ed ut
unde omnis
iste natus
accusantium doloremque
totam rem
eaque ipsa
quae ab
illo inventore
veritatis et
quasi architecto
beatae vitae
dicta sunt
Nemo enim
ipsam voluptatem
quia voluptas
sit aspernatur
aut odit
aut fugit
...
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...