Я хочу найти строку с помощью StringTokenizer, но в строке, которую я ищу, есть разделитель - Java - PullRequest
3 голосов
/ 11 января 2012

У меня есть внешний файл с именем quotes.txt, и я покажу вам его содержимое:

1 Everybody's always telling me one thing and out the other.
2 I love criticism just so long as it's unqualified praise.
3 The difference between 'involvement' and 'commitment' is like an eggs-and-ham 
  breakfast: the chicken was 'involved' - the pig was 'committed'.

Я использовал это: StringTokenizer str = new StringTokenizer(line, " .'");

Это коддля поиска:

String line = "";
boolean wordFound = false;

while((line = bufRead.readLine()) != null) {
    while(str.hasMoreTokens()) {
       String next = str.nextToken();
       if(next.equalsIgnoreCase(targetWord) {
            wordFound = true;
            output = line;
            break;
       }
    }

    if(wordFound) break;
    else output = "Quote not found";
}

Теперь я хочу найти строки "Everybody's" и "it's" в строках 1 и 2, но это не будет работать, так как апостроф является одним из разделителей.Если я удалю этот разделитель, то не смогу искать "involvement", "commitment", "involved" и "committed" в строке 3.

Какой подходящий код я могу сделать с этой проблемой?Пожалуйста, помогите и спасибо.

Ответы [ 2 ]

3 голосов
/ 11 января 2012

Я бы предложил использовать для этого регулярные выражения ( Pattern class ) вместо StringTokenizer.Например:

final Pattern targetWordPattern =
    Pattern.compile("\\b" + Pattern.quote(targetWord) + "\\b",
                    Pattern.CASE_INSENSITIVE);

String line = "";
boolean wordFound = false;

while((line = bufRead.readLine()) != null) {
    if(targetWordPattern.matcher(line).find()) {
        wordFound = true;
        break;
    }
    else
        output = "Quote not found";
}
1 голос
/ 11 января 2012

Токенизируйте по пробелу, затем обрезайте символом '.

...