Парсер Spirit QI end eom - PullRequest
       65

Парсер Spirit QI end eom

1 голос
/ 07 мая 2020

Мои данные определяются как:

std::string data("START34*23*43**");

Моя грамматика:

"START" >> boost::spirit::hex % '*'

Вопрос: Как разобрать конец сообщения, в котором есть две звезды?

https://wandbox.org/permlink/oDYjbBDb8fy79zQV

1 Ответ

0 голосов
/ 07 мая 2020

Не сразу понятно, о чем вы спрашиваете. Предполагая, что вы просто хотите «игнорировать» (или принимать) завершающие звездочки, вот ваш виновник:

if (first != last) // fail if we did not get a full match
    return false;

Простое удаление этих строк дает трюк:

Live On Coliru (примечание значительно упрощено):

#include <boost/spirit/include/qi.hpp>
#include <iomanip>

namespace qi = boost::spirit::qi;

template <typename Iterator>
bool parse_numbers(Iterator& first, Iterator last, std::vector<unsigned>& v) {
    return qi::phrase_parse(first, last, ("START" >> qi::hex % '*'), qi::space, v);
}

int main() {
    for (std::string const data : {
             "START34*23*43",
             "START34 * 23 * 43",
             "START34 * 23 * 43 *",
             "START34 * 23 * 43**",
             "START34 * 23 * 43* *",
         })
    {
        auto f = data.begin(), l = data.end();
        std::vector<unsigned> v;

        if (parse_numbers(f, l, v)) {
            std::cout << std::quoted(data) << " Parses OK: " << std::endl;

            for (auto i = 0u; i < v.size(); ++i)
                std::cout << i << ": " << v[i] << std::endl;
        } else {
            std::cout << "Parsing failed\n";
        }
        if (f != l) {
            std::cout << "Remaining unparsed: "
                      << std::quoted(std::string(f, l)) << "\n";
        }
    }
}

Печать

"START34*23*43" Parses OK: 
0: 52
1: 35
2: 67
"START34 * 23 * 43" Parses OK: 
0: 52
1: 35
2: 67
"START34 * 23 * 43 *" Parses OK: 
0: 52
1: 35
2: 67
Remaining unparsed: "*"
"START34 * 23 * 43**" Parses OK: 
0: 52
1: 35
2: 67
Remaining unparsed: "**"
"START34 * 23 * 43* *" Parses OK: 
0: 52
1: 35
2: 67
Remaining unparsed: "* *"

Альтернативно

Если вы действительно хотите игнорировать соседние **, но все же продолжить синтаксический анализ, тогда полезным изменением будет -qi::hex % '*' вместо qi::hex % '*', что просто делает hex необязательным.

Live On Coliru

#include <boost/spirit/include/qi.hpp>
#include <iomanip>

namespace qi = boost::spirit::qi;

template <typename Iterator>
bool parse_numbers(Iterator& first, Iterator last, std::vector<unsigned>& v) {
    return qi::phrase_parse(first, last,
            ("START" >> -qi::hex % '*'), qi::space, v);
}

int main() {
    for (std::string const data : {
             "START34**23*43",
             "START34 * 23 * 43**",
             "START*******",
             "START*******1 BOGUS",
         })
    {
        auto f = data.begin(), l = data.end();
        std::vector<unsigned> v;

        if (parse_numbers(f, l, v)) {
            std::cout << std::quoted(data) << " Parses OK: " << std::endl;

            for (auto i = 0u; i < v.size(); ++i)
                std::cout << i << ": " << v[i] << std::endl;
        } else {
            std::cout << "Parsing failed\n";
        }
        if (f != l) {
            std::cout << "Remaining unparsed: "
                      << std::quoted(std::string(f, l)) << "\n";
        }
    }
}

Распечатывает

"START34**23*43" Parses OK: 
0: 52
1: 35
2: 67
"START34 * 23 * 43**" Parses OK: 
0: 52
1: 35
2: 67
"START*******" Parses OK: 
"START*******1 BOGUS" Parses OK: 
0: 1
Remaining unparsed: "BOGUS"

В этом случае вы можете повторно подтвердить, что весь ввод анализируется с помощью >> qi::eoi (что лучше проверки итераторов вручную), см. Live On Coliru :

"START34**23*43" OK: 
0: 52
1: 35
2: 67
"START34 * 23 * 43**" OK: 
0: 52
1: 35
2: 67
"START*******" OK: 
"START*******1 BOGUS" Failed

ОБНОВЛЕНИЕ

К обновленному вопросу в вашем комментарии :

@ sehe Примерно так: coliru.stacked-crooked.com/a/5ecc5462a8dc0081 - user3314011 19 минут a go

Yo Вам нужен негативный прогноз, чтобы исключить **:

"START" >> (qi::hex % (qi::lit('*') - "**")) >> "**"

На самом деле, давайте добавим несколько точек ожидания (> вместо >>):

    try {
        return qi::parse(first, last, "START" > (qi::hex % (qi::lit('*') - "**")) > "**" > qi::eoi, v);
    } catch (qi::expectation_failure<Iterator> const& ef) {
        std::ostringstream msg;
        msg << "Expected " << ef.what_ << " at " << std::quoted(std::string(ef.first, ef.last), '\'');
        throw ParseError(msg.str());
    }

Теперь вы также можете получить несколько приличных сообщений об ошибках:

Live On Coliru

#include <boost/spirit/include/qi.hpp>
#include <iomanip>

namespace qi = boost::spirit::qi;

struct ParseError : std::runtime_error {
    ParseError(std::string msg) : std::runtime_error(std::move(msg)) {}
};

template <typename Iterator>
bool parse_numbers(Iterator& first, Iterator last, std::vector<unsigned>& v) {
    try {
        return qi::parse(first, last, "START" > (qi::hex % (qi::lit('*') - "**")) > "**" > qi::eoi, v);
    } catch (qi::expectation_failure<Iterator> const& ef) {
        std::ostringstream msg;
        msg << "Expected " << ef.what_ << " at " << std::quoted(std::string(ef.first, ef.last), '\'');
        throw ParseError(msg.str());
    }
}

int main() {
    for (std::string const data : {
             "START34*23*43",       // Fail no EOM
             "START34 * 23 * 43",   // Fail spaces
             "START34*23*43*",      // Fail no EOM
             "START34*23*43**",     // OK
             "START34*23*43**1",    // Fail extra number
         })
    {
        std::cout << std::quoted(data) << " -> ";

        auto f = data.begin(), l = data.end();
        std::vector<unsigned> v;

        try {
            if (parse_numbers(f, l, v)) {
                std::cout << " OK:";

                for (auto i : v)
                    std::cout << " " << i;
                std::cout << "\n";
            } else {
                std::cout << "Not matched\n";
            }
        } catch(ParseError const& pe) {
            std::cout << "Error: " << pe.what() << "\n";
        }
    }
}

Печать:

"START34*23*43" -> Error: Expected "**" at ''
"START34 * 23 * 43" -> Error: Expected "**" at ' * 23 * 43'
"START34*23*43*" -> Error: Expected "**" at '*'
"START34*23*43**" ->  OK: 52 35 67
"START34*23*43**1" -> Error: Expected <eoi> at '1'

...