Выражение регулярных выражений в программе не работает - PullRequest
0 голосов
/ 29 января 2019

Я пишу программу, которая будет читать текстовый файл и выдавать ошибку, если в тексте есть какие-либо символы, которые не являются пробелами или символами слова.Выражение регулярного выражения кажется правильным, но оно не работает.

Например, следующие тексты:

  • Harry Potter$
  • Harry Potter
  • &&&&&&&&&&&&&&&&&&uvuoyvouyvouyvouyvouyv78789******

отображается в консоли без ошибки

Я также проверил выражение регулярного выражения на https://regexr.com/ *

Двойной \ необходим, поскольку в противном случае я получаю сообщение об ошибке Недопустимый escape-символ

import java.io.*;

public class DZ {
    public static void main(String[] args) throws IOException {
        try {
            System.out.println(method());
        } catch(Exception e){
            System.out.println(e);
        }
    }

    public static boolean compare(char wrt) {
        String str = "[^\\s\\w]";
        for (int i = 0; i < str.length(); i++) {
            if (str.charAt(i) == wrt) {
                return true;
            }
        }
        return false;
    }

    public static StringBuilder method() throws Exception {
        int data;

        FileReader fr = new FileReader("/Users/rachel_green/Documents/1.txt");
        StringBuilder str = new StringBuilder();
        while ((data = fr.read()) != -1) {
            if (compare((char)data)) {
                throw new Exception("Wrong file format");
            } else {
                str.append((char) data);
            }
        }

        return str;
    }
}

Ответы [ 2 ]

0 голосов
/ 29 января 2019

В приведенном выше коде вы выполняете итерацию для каждого символа, вместо этого вы можете сопоставить каждую строку во входном файле с шаблоном.

public static boolean compare(String wrt)
{
    Pattern regex = Pattern.compile("[^\\s\\w]");

    Matcher matcher = regex.matcher(wrt);
    return matcher.find();
}

public static StringBuilder method() throws Exception
{
    FileReader fr = new FileReader("/Users/rachel_green/Documents/1.txt");

    BufferedReader bR = new BufferedReader(fr);
    StringBuilder str = new StringBuilder();
    String line;
    while ((line = bR.readLine()) != null)
    {
        if (compare(line))
        {
            throw new Exception("Wrong file format");
        }
        else
        {
            str.append(line);
        }
    }
    return str;
}

Надеюсь, это поможет.

0 голосов
/ 29 января 2019

Вы сравниваете String с char и перебираете строку, содержащую ваш RegEx - что не имеет смысла:

public static boolean compare(char wrt){
    String str = "[^\\s\\w]";
    for(int i=0;i<str.length();i++){ //why are you diong this?
        if(str.charAt(i) == wrt) //you are checking every char of the regex agains the input char!
            return true;
    }
    return false;
}

Вместо этого вы можете сделать это:

public static boolean compare(char wrt){
    return (wrt + "").matches("[^\\s\\w]");
}

Также, возможно, будет хорошей идеей просто прекратить чтение файла при первом обнаружении недопустимого символа.В противном случае на самом деле не имеет смысла проверять каждый отдельный char вместо содержимого всего файла (например, content.matches(".*[^\\s\\w].*"). Выдайте свое исключение только один раз и break; цикл, читающий файл тогда!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...