Включить ведущие нули в результаты анализа Boost Spirit x3 - PullRequest
1 голос
/ 06 апреля 2019

Интересно, можно ли сохранить ведущие нули при разборе чисел с помощью Boost Spirit X3.В настоящее время у меня есть программа (на основе выборки сотрудников), которая анализирует целые числа в моей структуре данных.Однако при разборе я теряю ведущие нули.Это проблема для моей прикладной области, в которой начальные нули перед любым целым числом дают другую интерпретацию.

  #include <boost/spirit/home/x3.hpp>
  #include <boost/spirit/include/support_istream_iterator.hpp>
  #include <boost/fusion/adapted/struct.hpp>
  #include <iostream>

  namespace client {
    namespace ast {
        struct number
        {
            int number;
        };
    }
  }
  BOOST_FUSION_ADAPT_STRUCT(client::ast::number, number)

  namespace client
  {
    namespace parser
    {
        namespace x3 = boost::spirit::x3;
        using x3::int_;
        x3::rule<class number, ast::number> const number = "number";
        auto const number_def = int_;
        BOOST_SPIRIT_DEFINE(number)
    }
  }

  int main()
  {
    using boost::spirit::x3::ascii::space;
    using client::parser::number;
    std::istringstream iss("1 02 030 00400 0005");
    std::vector<client::ast::number> nums;
    boost::spirit::istream_iterator iter(iss >> std::noskipws), eof;
    bool ok = phrase_parse(iter, eof, *number, space, nums);
    if (ok)
    {
        std::cout << "parsed: " << std::endl;
        for (size_t i = 0; i < nums.size(); ++i)
        {
            std::cout << nums[i].number << "\n";
        }
    }
  }

Результат программы:

  parsed:
  1
  2
  30
  400
  5

, тогда как мне нужно

  parsed:
  1
  02
  030
  00400
  00005

РЕДАКТИРОВАТЬ

Я достиг определенного прогресса в этом отношении:

http://coliru.stacked -crooked.com / a / 9f06f02613956230

#include <boost/spirit/home/x3.hpp>
#include <boost/fusion/adapted/struct.hpp>

namespace x3 = boost::spirit::x3;
namespace ast {
    struct fullnumber
    {
        std::string leadingZeros = "";
        int number = -1;
    };
}

BOOST_FUSION_ADAPT_STRUCT(ast::fullnumber, leadingZeros, number)
x3::rule<class fullnumber, ast::fullnumber> const fullnumber = "fullnumber";
auto const fullnumber_def = x3::lexeme[-(+x3::char_("0") >> &x3::int_) >> +x3::int_];
BOOST_SPIRIT_DEFINE(fullnumber);

int main() {
    std::vector<ast::fullnumber> fullnumbers;
    std::string parse_numbers_input("0 1 00 01 20 003000 00004 500000");
    auto begin = parse_numbers_input.begin();
    auto end = parse_numbers_input.end();
    bool ok = phrase_parse(begin, end, *fullnumber, x3::space, fullnumbers);
    if (ok) {
        std::cout << "parsed: " << std::endl;
        for (auto n : fullnumbers)
            std::cout << "leading: '" << n.leadingZeros << "', num: " << n.number << "\n";
    }
}
parsed: 
leading: '0', num: 0
leading: '', num: 1
leading: '00', num: 0
leading: '0', num: 1
leading: '', num: 20
leading: '00', num: 3000
leading: '0000', num: 4
leading: '', num: 500000

Как видите, я уже близок к тому, что хочу.Хитрость заключалась в том, чтобы понять, что x3 :: lexeme требуется, потому что, если мы не используем это, синтаксический анализатор всегда будет использовать разделитель между каждым элементом.Итак, x3 :: lexeme [- (+ x3 :: char _ ("0") >> & x3 :: int_) >> + x3 :: int_];говорит: [необязательно] все нули, за которыми следует целое число (не потребляет), за которым следует целое число.

У меня просто есть еще один вопрос о том, что делает анализатор:

|----|----------|----------|-----------|----------|
| id | input    | leading  | number    | expected |
|----|----------|----------|-----------|----------|
| 1  |   0      |     0    |    0      |    no    |
|----|----------|----------|-----------|----------|
| 2  |   1      |          |    1      |    yes   |
|----|----------|----------|-----------|----------|
| 3  |   00     |     00   |    0      |    no    |
|----|----------|----------|-----------|----------|
| 4  |   01     |     0    |    1      |    yes   |
|----|----------|----------|-----------|----------|
| 5  |   20     |          |    20     |    yes   |
|----|----------|----------|-----------|----------|
| 6  |   003000 |     00   |    3000   |    yes   |
|----|----------|----------|-----------|----------|
| 7  |   00004  |     0000 |    4      |    yes   |
|----|----------|----------|-----------|----------|
| 8  |   500000 |          |    500000 |    yes   |
|----|----------|----------|-----------|----------|
  • Для 1 я ожидаю ведущего = "", num = "0"
  • Для 3 я ожидаю ведущего = "0", num = "0"

Как получится0 встречается дважды в этих случаях?

1 Ответ

1 голос
/ 07 апреля 2019

Как сказал другой комментатор, просто проанализируйте строки.

Если вы все еще хотите, чтобы анализатор Spirit * int_ анализировал целые числа (со знаком), оберните его в raw[] для распространения на диапазоны итераторов (которые совместимы со строками):

Live On Coliru

#include <boost/spirit/home/x3.hpp>
#include <boost/spirit/include/support_istream_iterator.hpp>
#include <iostream>
#include <iomanip>

namespace x3 = boost::spirit::x3;

int main() {
    std::istringstream iss("1 02 030 00400 0005");
    std::vector<std::string> nums;
    boost::spirit::istream_iterator iter(iss >> std::noskipws), eof;

    bool ok = phrase_parse(iter, eof, *x3::raw[x3::int_], x3::space, nums);
    if (ok) {
        std::cout << "parsed: " << std::endl;
        for (auto num : nums)
            std::cout << std::quoted(num) << "\n";
    }
}

печать

parsed: 
"1"
"02"
"-030"
"00400"
"0005"
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...