Захват ошибок компиляции регулярных выражений - PullRequest
7 голосов
/ 21 августа 2010

Я пытаюсь настроить службу, подобную rubular , но с PHP в качестве языка, использующего семейство функций preg. Он примет входное регулярное выражение, тестовую строку и запустит preg_match().

Как я могу узнать, произошла ли ошибка компиляции (например, неверное регулярное выражение), и если это так, то что это была за ошибка? Обычно он будет выдавать предупреждения, такие как:

Warning: preg_match() [function.preg-match]: Compilation failed: missing ) at offset x in ****** on line y

pcre_last_error() здесь совершенно бесполезен, так как он вернет 0 (PREG_NO_ERROR), если регулярное выражение не скомпилируется.

Один из вариантов, который я рассматриваю, заключается в использовании буферизации вывода для захвата предупреждения, но должен быть лучший способ.

Ответы [ 2 ]

2 голосов
/ 21 августа 2010

Лучшее, что вы можете сделать, это опустить сообщение об ошибке с помощью @, проверить возвращаемое значение и, если false, позвонить error_get_last.

Вы также можетенапишите свою собственную обертку вокруг pcre_compile.Он получает указатели для хранения кодов ошибок и строк.Не должно быть слишком сложно;preg_match - это тонкая обертка.

0 голосов
/ 06 января 2012

Вы можете легко проверить наличие ошибок компиляции в PHP, зарегистрировав свой собственный обработчик ошибок.Я написал тестер регулярных выражений PHP, который обнаруживает ошибки компиляции регулярных выражений и сообщает о них пользователю без отображения конфиденциальной информации, такой как имена файлов и номера строк.Ключевой частью здесь является то, что пользовательский обработчик ошибок может перехватывать ошибки компиляции регулярных выражений.Вам не нужно бросать исключение или ловить его.Остальное - удобная демонстрация.

Я использую set_error_handler () для регистрации функции, которая выдает исключение ErrorException.Я ловлю исключение при запуске preg_match (), затем использую информацию трассировки, чтобы убедиться, что исключение было сгенерировано из того же файла, строки и функции, из которой я запускаю preg_match () (если нет, ошибка или исключение вызвано чем-тоеще как другой вызов функции в той же строке или PHP не хватает памяти).Затем я выводю только сообщение об ошибке пользователю.

Обратите внимание, что этот скрипт фактически выполняет функцию регулярного выражения, используя функцию переменной.Введите входные данные, регулярное выражение без начального и конечного слеша и любые модификаторы отдельно.

Вот полный код:

<code><!DOCTYPE html>
<html>
<head>
    <title>Test</title>
    <style type="text/css">
        body {
            font-family: monospace;
        }

        input[type=text], textarea {
            letter-spacing: .25em;
            font-weight: bold;
            font-size: larger;
        }

        textarea {
            width: 100%;
            height: 25%;
        }

        fieldset {
            display: inline;
        }

        .error {
            color: red;
        }
    </style>
</head>
<body onload="document.getElementById('patterninput').focus();">
    <?php
        // Translate old-style PHP errors to OO approach
        // http://www.php.net/manual/en/class.errorexception.php
        function testRegexErrorHandler($errno, $errstr, $errfile, $errline, $errcontext) {
            throw new ErrorException($errstr, 0, $errno, $errfile, $errline);
        }

        $pattern = isset($_REQUEST["pattern"]) ? $_REQUEST["pattern"] : "";
        $mods = isset($_REQUEST["mods"]) ? $_REQUEST["mods"] : "";
        $input = isset($_REQUEST["input"]) ? $_REQUEST["input"] : "";

        $regex = "/$pattern/$mods";
        $fns = array("match" => "preg_match", "matchall" => "preg_match_all");
        $fnKey = isset($_REQUEST["function"]) ? $_REQUEST["function"] : "matchall";
        $fn = isset($fns[$fnKey]) ? $fns[$fnKey] : "preg_match_all";

        try {
            set_error_handler("testRegexErrorHandler");
            $result = $fn($regex, $input, $matches);
        } catch (Exception $ex) {
            // $ex is used later
        }
        restore_error_handler();
    ?>
    <form action="" method="post">
        <input type="text" size="100" id="patterninput" name="pattern" value="<?php echo htmlspecialchars($pattern); ?>" placeholder="Pattern" />
        <input type="text" size="10" name="mods" value="<?php echo htmlspecialchars($mods); ?>" placeholder="Modifiers" />
        <fieldset><legend>Function</legend>
            <label for="fnmatch">preg_match()</label><input type="radio" name="function" value="match" id="fnmatch" <?php echo $fnKey == "match" ? "checked" : ""; ?> />
            <label for="fnmatchall">preg_match_all()</label><input type="radio" name="function" value="matchall" id="fnmatchall" <?php echo $fnKey == "matchall" ? "checked" : ""; ?> />
        </fieldset>
        <input type="submit" name="submit" />
        <textarea name="input" rows="10" placeholder="Input"><?php echo htmlspecialchars($input); ?></textarea>
    </form>
    <br/>
<?php
if(isset($ex)) {
    $trace = $ex->getTrace();
    if(is_array($trace) && isset($trace[1]) && is_array($trace[1])) {
        $errFn = isset($trace[1]["function"]) ? $trace[1]["function"] : "";
        $errLine = isset($trace[1]["line"]) ? $trace[1]["line"] : "";
        $errFile = isset($trace[1]["file"]) ? $trace[1]["file"] : "";

        if($errFn != "" && $errFn == $fn && $errLine != "" && $errLine == $ex->getLine() && $errFile != "" && $errFile == $ex->getFile() && get_class($ex) == "ErrorException") {
            $regexErr = true;
        }
    }

    if(empty($regexErr)) {
        throw $ex;
    } else {
        echo "<p class=\"error\">The following error has occurred and is probably an error in your regex syntax:<br/>" .htmlspecialchars($ex->getMessage()) ."</p>\n\n";
    }
}

// result will be unset if error or exception thrown by regex function
//  such as if expression is syntactically invalid
if(isset($_REQUEST["submit"]) && isset($result)) {
    echo "Result: $result<br/>\n";
    echo "Matches:<pre>" .htmlspecialchars(print_r($matches, true)) ."
\ n \ n ";}?>
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...