Убедитесь, что строка соответствует формату строки - PullRequest
14 голосов
/ 25 августа 2011

Как определить, соответствует ли строка в строке формата (то есть: song%03d.mp3)?

Другими словами, как бы вы реализовали следующую функцию?

/**
* @return true if formatted equals String.format(format, something), false otherwise.
**/
boolean matches(String formatted, String format);

Примеры:

matches("hello world!", "hello %s!"); // true
matches("song001.mp3", "song%03d.mp3"); // true
matches("potato", "song%03d.mp3"); // false

Может быть, есть способ преобразовать строку формата в регулярное выражение?

Уточнение

Строка формата являетсяпараметр.Я не знаю это заранее.song%03d.mp3 это просто пример.Это может быть любая другая строка формата.

Если это поможет, я могу предположить, что строка формата будет иметь только один параметр.

Ответы [ 7 ]

9 голосов
/ 25 августа 2011

Я не знаю библиотеки, которая это делает. Вот пример того, как преобразовать шаблон формата в регулярное выражение. Обратите внимание, что Pattern.quote важно для обработки случайных регулярных выражений в строке формата.

// copied from java.util.Formatter
// %[argument_index$][flags][width][.precision][t]conversion
private static final String formatSpecifier
    = "%(\\d+\\$)?([-#+ 0,(\\<]*)?(\\d+)?(\\.\\d+)?([tT])?([a-zA-Z%])";

private static final Pattern formatToken = Pattern.compile(formatSpecifier);

public Pattern convert(final String format) {
    final StringBuilder regex = new StringBuilder();
    final Matcher matcher = formatToken.matcher(format);
    int lastIndex = 0;
    regex.append('^');
    while (matcher.find()) {
        regex.append(Pattern.quote(format.substring(lastIndex, matcher.start())));
        regex.append(convertToken(matcher.group(1), matcher.group(2), matcher.group(3), 
                                  matcher.group(4), matcher.group(5), matcher.group(6)));
        lastIndex = matcher.end();
    }
    regex.append(Pattern.quote(format.substring(lastIndex, format.length())));
    regex.append('$');
    return Pattern.compile(regex.toString());
}

Конечно, реализация convertToken будет сложной задачей. Вот с чего начать:

private static String convertToken(String index, String flags, String width, String precision, String temporal, String conversion) {
    if (conversion.equals("s")) {
        return "[\\w\\d]*";
    } else if (conversion.equals("d")) {
        return "[\\d]{" + width + "}";
    }
    throw new IllegalArgumentException("%" + index + flags + width + precision + temporal + conversion);
}
1 голос
/ 25 августа 2011

Нет простого способа сделать это. Прямой способ - написать код, который преобразует строки формата (или их более простое подмножество) в регулярные выражения, а затем сопоставляет их с использованием стандартных классов регулярных выражений.

Возможно, лучше переосмыслить / реорганизовать ваш код. Зачем тебе это?

1 голос
/ 25 августа 2011

Поскольку вы заранее не знаете формат, вам придется написать метод, который преобразует строку формата в регулярное выражение.Не тривиально, но возможно.Вот простой пример для двух тестовых случаев, которые вы дали:

public static String getRegexpFromFormatString(String format)
{
    String toReturn = format;

    // escape some special regexp chars
    toReturn = toReturn.replaceAll("\\.", "\\\\.");
    toReturn = toReturn.replaceAll("\\!", "\\\\!");

    if (toReturn.indexOf("%") >= 0)
    {
        toReturn = toReturn.replaceAll("%s", "[\\\\w]+"); //accepts 0-9 A-Z a-z _

        while (toReturn.matches(".*%([0-9]+)[d]{1}.*"))
        {
            String digitStr = toReturn.replaceFirst(".*%([0-9]+)[d]{1}.*", "$1");
            int numDigits = Integer.parseInt(digitStr);
            toReturn = toReturn.replaceFirst("(.*)(%[0-9]+[d]{1})(.*)", "$1[0-9]{" + numDigits + "}$3");
        }
    }

    return "^" + toReturn + "$";
}

и некоторый тестовый код:

public static void main(String[] args) throws Exception
{
    String formats[] = {"hello %s!", "song%03d.mp3", "song%03d.mp3"};
    for (int i=0; i<formats.length; i++)
    {
        System.out.println("Format in [" + i + "]: " + formats[i]);
        System.out.println("Regexp out[" + i + "]: " + getRegexp(formats[i]));
    }

    String[] words = {"hello world!", "song001.mp3", "potato"};
    for (int i=0; i<formats.length; i++)
    {
        System.out.println("Word [" + i + "]: " + words[i] +
            " : matches=" + words[i].matches(getRegexpFromFormatString(formats[i])));
    }
}
1 голос
/ 25 августа 2011

Вы можете использовать регулярные выражения Java - см. http://www.vogella.de/articles/JavaRegularExpressions/article.html

Спасибо ...

0 голосов
/ 25 августа 2011

у класса string есть метод match, вы можете передать туда регулярное выражение. String.matches (String)

для регулярного выражения вы можете увидеть это: http://download.oracle.com/javase/1,5.0/docs/api/java/util/regex/Pattern.html
Примеры:

"song001.mp3".matches("song\\d{3}\\.mp3");
0 голосов
/ 25 августа 2011

Вы можете использовать String.matches ;хотя тогда вам нужно будет использовать регулярное выражение, а не строку формата.

Не должно быть слишком сложно заменить что-то вроде% 03d на \ d {3} регулярное выражение

Пример:

"song001.mp3" .matches ("song \\ d {3} \\. Mp3") // True

"potato" .matches ("song \\ d {3} \\. mp3") // False

Если вам действительно нужна строка формата, вам нужно создать функцию, которая заменяет формат эквивалентом регулярного выраженияи экранирует зарезервированные символы регулярного выражения;затем используйте функцию String.matches.

0 голосов
/ 25 августа 2011

Вы можете использовать класс Pattern, чтобы реализовать метод, чтобы делать то, что вы хотите.Посмотрите на примеры на странице Pattern Java API .

...