Как получить строку из синтаксического анализатора лексемы Boost Spirit X3? - PullRequest
2 голосов
/ 16 января 2020

Какой самый простой способ сделать действие semanti c, которое извлекает строку из типичного анализатора идентификаторов на основе boost::spirit::x3::lexeme?

Я подумал, что можно обойти необходимость распаковать атрибут и просто использовать итераторы во входном потоке, но, видимо, x3::_where не делает то, что я думаю.

Следующее дает output пустым. Я ожидал, что он будет содержать "foobar_hello".

namespace x3 = boost::spirit::x3;

using x3::_where;
using x3::lexeme;
using x3::alpha;

auto ctx_to_string = [&](auto& ctx) {
    _val(ctx) = std::string(_where(ctx).begin(), _where(ctx).end());
};

x3::rule<class identifier_rule_, std::string> const identifier_rule = "identifier_rule";
auto const identifier_rule_def = lexeme[(x3::alpha | '_') >> *(x3::alnum | '_')][ctx_to_string];
BOOST_SPIRIT_DEFINE(identifier_rule);

int main()
{
    std::string input = "foobar_hello";

    std::string output;
    auto result = x3::parse(input.begin(), input.end(), identifier_rule, output);
}

Нужно ли каким-то образом извлекать строку из объектов boost :: fusion в x3::_attr(ctx) или я что-то не так делаю?

1 Ответ

3 голосов
/ 16 января 2020

Вы можете просто использовать автоматическое c распространение атрибута, то есть вам не нужно semanti c action (1)

Live On Coliru

#include <iostream>
#include <iomanip>
#define BOOST_SPIRIT_X3_DEBUG
#include <boost/spirit/home/x3.hpp>
namespace x3 = boost::spirit::x3;

namespace P {
    x3::rule<class identifier_rule_, std::string> const identifier_rule = "identifier_rule";
    auto const identifier_rule_def = x3::lexeme[(x3::alpha | x3::char_('_')) >> *(x3::alnum | x3::char_('_'))];
    BOOST_SPIRIT_DEFINE(identifier_rule)
}

int main() {
    std::string const input = "foobar_hello";

    std::string output;
    auto result = x3::parse(input.begin(), input.end(), P::identifier_rule, output);
}

Печать

<identifier_rule>
  <try>foobar_hello</try>
  <success></success>
  <attributes>[f, o, o, b, a, r, _, h, e, l, l, o]</attributes>
</identifier_rule>

Примечание. Я изменил '_' на x3::char_('_') для захвата подчеркивания (x3::lit не захватывает то, что это соответствует)

Если вы настаиваете на семанти c действиях,

  • рассмотрите возможность использования rule<..., std::string, true> до также force automati c attrobute распространение
  • не предполагает, что _where указывает на то, на что вы надеетесь: http://coliru.stacked-crooked.com/a/336c057dabc86a84
  • используйте x3::raw[] для представления диапазона итератора управляемого источника ( http://coliru.stacked-crooked.com/a/80a69ae9b99a4c61)

    auto ctx_to_string = [](auto& ctx) {
        std::cout << "\nSA: '" << _attr(ctx) << "'" << std::endl;
        _val(ctx) = std::string(_attr(ctx).begin(), _attr(ctx).end());
    };
    
    x3::rule<class identifier_rule_, std::string> const identifier_rule = "identifier_rule";
    auto const identifier_rule_def = x3::raw[ lexeme[(x3::alpha | '_') >> *(x3::alnum | '_')] ] [ctx_to_string];
    BOOST_SPIRIT_DEFINE(identifier_rule)
    

    Обратите внимание, что char_('_') больше не имеет значения

  • рассмотрите возможность использования встроенных помощников атрибутов: http://coliru.stacked-crooked.com/a/3e3861330494e7c9

    auto ctx_to_string = [](auto& ctx) {
        using x3::traits::move_to;
        move_to(_attr(ctx), _val(ctx));
    };
    

    Обратите внимание, как это приближает распространение встроенного атрибута, хотя это гораздо менее гибко, чем позволить Spirit управлять им

...