регулярные выражения уходят на символ - PullRequest
4 голосов
/ 24 декабря 2011

Я должен разделить большой список адресов электронной почты и имен, я должен разделить запятыми, но некоторые имена имеют запятые в них, поэтому я должен сначала разобраться с этим. К счастью, имена заключены в кавычки.

В данный момент я получаю с выводом регулярных выражений, например, вот так (правка: на форуме я не вижу сообщений электронной почты!):

"Talboom, Esther"

"Wolde, Jos van der"

"Debbie Derksen"  <deberken@casema.nl>,   corine  <corine5@xs4all.nl>, "

Последнее пошло не так, потому что у имени не было запятой, поэтому оно продолжается до тех пор, пока оно не будет найдено, и именно это я хочу использовать для разделения. Поэтому я хочу, чтобы он смотрел, пока не найдет «<». Как я могу это сделать? </p>

import java.util.regex.Pattern;
import java.util.regex.Matcher;

String test = "\"Talboom, Esther\" <E.Talboom@wegener.nl>,     \"Wolde, Jos van der\" <J.vdWolde@wegener.nl>,   \"Debbie Derksen\"  <deberken@casema.nl>,   corine  <corine5@xs4all.nl>, \"Markies Aart\" <A.Markies@wegenernieuwsmedia.nl>";

Pattern pattern = Pattern.compile("\".*?,.*?\"");

Matcher matcher = pattern.matcher(test);

boolean found = false;
while (matcher.find ()) {
  System.out.println(matcher.group());
}

редактирование: Лучшая строка для работы, так как не у всех есть имя или кавычки:

String test = "\"Talboom, Esther\" <E.Talboom@wegener.nl>,     DRP - Wouter Haan <wouter@drp.eu>, \"Wolde, Jos van der\" <J.vdWolde@wegener.nl>,   \"Debbie Derksen\"  <deberken@casema.nl>,   corine  <corine5@xs4all.nl>, clankilllller@gmail.com, \"Markies Aart\" <A.Markies@wegenernieuwsmedia.nl>";

1 Ответ

2 голосов
/ 24 декабря 2011

Я бы упростил код, используя String.split и String.replaceAll.Это позволяет избежать хлопот по работе с Pattern и делает код аккуратным и коротким.
Попробуйте:

public static void main(String[] args) {
    String test = "\"Talboom, Esther\" <E.Talboom@wegener.nl>,     \"Wolde, Jos van der\" <J.vdWolde@wegener.nl>,   \"Debbie Derksen\"  <deberken@casema.nl>,   corine  <corine5@xs4all.nl>, \"Markies Aart\" <A.Markies@wegenernieuwsmedia.nl>";

    // Split up into each person's details
    String[] nameEmailPairs = test.split(",\\s*(?=\")");
    for (String nameEmailPair : nameEmailPairs) {
        // Extract exactly the parts you need from the person's details
        String name = nameEmailPair.replaceAll("\"([^\"]+)\".*", "$1");
        String email = nameEmailPair.replaceAll(".*<([^>]+).*", "$1");
        System.out.println(name + " = " + email);
    }
}

Вывод, показывающий, что он действительно работает:)

Talboom, Esther = E.Talboom@wegener.nl
Wolde, Jos van der = J.vdWolde@wegener.nl
Debbie Derksen = corine5@xs4all.nl
Markies Aart = A.Markies@wegenernieuwsmedia.nl
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...