Я использую парсер, который пропускает пробелы. В какой-то момент я не хочу пропустить, поэтому я хочу использовать qi::lexeme
. Однако это либо не компилирует, либо портит мои результаты. Я особенно не могу понять последний пункт. Как обрабатываются атрибуты lexeme
?
Вот пример того, что я пытаюсь сделать:
#include <iostream>
#include <iomanip>
#include <string>
#include <boost/spirit/include/qi.hpp>
#include <boost/fusion/include/vector.hpp>
namespace qi = boost::spirit::qi;
namespace fu = boost::fusion;
struct printer_type
{
void operator() (int i) const
{
std::cout << i << ' ';
}
void operator() (std::string s) const
{
std::cout << '"' << s << '"' << ' ';
}
} printer;
int main() {
for (std::string str : { "1foo 13", "42 bar 13", "13cheese 8", "101pencil13" }) {
auto iter = str.begin(), end = str.end();
qi::rule<std::string::iterator, qi::blank_type, fu::vector<int, std::string, int>()> parser = qi::int_ >> +qi::alpha >> qi::int_;
fu::vector<int, std::string, int> result;
bool r = qi::phrase_parse(iter, end, parser, qi::blank, result);
std::cout << " --- " << std::quoted(str) << " --- ";
if (r) {
std::cout << "parse succeeded: ";
fu::for_each(result, printer);
std::cout << '\n';
} else {
std::cout << "parse failed.\n";
}
if (iter != end) {
std::cout << " Remaining unparsed: " << std::string(iter, str.end()) << '\n';
}
}
}
Обратите внимание на эту строку:
qi::rule<std::string::iterator, qi::blank_type, fu::vector<int, std::string, int>()> parser =
qi::int_ >> +qi::alpha >> qi::int_;
Хорошо, мы хотим использовать int, затем строку, а затем снова int. Однако я не хочу пропускать пробел между первым int и строкой, здесь не должно быть пробела. Если я использую лексему, синтезированные атрибуты будут испорчены.
Прогон без lexeme
дает следующие результаты:
--- "1foo 13" --- parse succeeded: 1 "foo" 13
--- "42 bar 13" --- parse succeeded: 42 "bar" 13
--- "13cheese 8" --- parse succeeded: 13 "cheese" 8
--- "101pencil13" --- parse succeeded: 101 "pencil" 13
Так что все хорошо разбирает, что хорошо. Однако второй пример (42 bar 13
) не должен успешно анализироваться, поэтому вот результат с lexeme
вокруг первого целого и строки (qi::lexeme[qi::int_ >> +qi::alpha] >> qi::int_;
):
" 0 "1foo 13" --- parse succeeded: 1 "
--- "42 bar 13" --- parse failed.
Remaining unparsed: 42 bar 13
--- "13cheese 8" --- parse succeeded: 13 " 0
" 0 "101pencil13" --- parse succeeded: 101 "
Что !? Я не имею ни малейшего понятия, что происходит, я рад любому просвещению:)
Дополнительный вопрос: я бы хотел полностью опустить lexeme
и определить подчиненное правило, которое не пропускается. Как я могу указать атрибуты в этом случае?
Тогда у подправления есть атрибут fusion::vector<int, std::string>()
, но я все же хочу, чтобы в качестве основного правила использовался атрибут fusion::vector<int, std::string, int>()
, а не fusion::vector<fusion::vector<int, std::string>, int>()
(который все равно не компилируется).