Вы копируете только 4 символа (в зависимости от ширины указателя вашей системы).Это приведет к тому, что числа из 4+ символов, не равные NULL, будут завершены, что приведет к тому, что на входе atoi
sizeof(str.c_str()) //i.e. sizeof(char*) = 4 (32 bit systems)
должны появиться строки с пробелами
str.length() + 1
.1007 *
Только STL:
make_testdata()
: просмотреть все пути вниз
Почему бы вам не использовать потоки ...?
#include <sstream>
#include <iostream>
#include <algorithm>
#include <iterator>
#include <string>
#include <vector>
int main()
{
std::vector<int> data = make_testdata();
std::ostringstream oss;
std::copy(data.begin(), data.end(), std::ostream_iterator<int>(oss, "\t"));
std::stringstream iss(oss.str());
std::vector<int> clone;
std::copy(std::istream_iterator<int>(iss), std::istream_iterator<int>(),
std::back_inserter(clone));
//verify that clone now contains the original random data:
//bool ok = std::equal(data.begin(), data.end(), clone.begin());
return 0;
}
Вы могли бы сделать это намного быстрее в простом C с atoi / itoa и некоторыми хитростями, но я считаю, что вы должны использовать двоичную передачу (см. Boost Spirit Karma и protobuf для хороших библиотек) если вам нужна скорость.
Boost Karma / Qi:
#include <boost/spirit/include/qi.hpp>
#include <boost/spirit/include/karma.hpp>
namespace qi=::boost::spirit::qi;
namespace karma=::boost::spirit::karma;
static const char delimiter = '\0';
int main()
{
std::vector<int> data = make_testdata();
std::string astext;
// astext.reserve(3 * sizeof(data[0]) * data.size()); // heuristic pre-alloc
std::back_insert_iterator<std::string> out(astext);
{
using namespace karma;
generate(out, delimit(delimiter) [ *int_ ], data);
// generate_delimited(out, *int_, delimiter, data); // equivalent
// generate(out, int_ % delimiter, data); // somehow much slower!
}
std::string::const_iterator begin(astext.begin()), end(astext.end());
std::vector<int> clone;
qi::parse(begin, end, qi::int_ % delimiter, clone);
//verify that clone now contains the original random data:
//bool ok = std::equal(data.begin(), data.end(), clone.begin());
return 0;
}
Если вы хотите вместо этого выполнять двоичную сериализацию, независимую от архитектуры, вы бы использовали эту крошечную адаптацию, создающуювещи в миллиард раз быстрее ( см. тест ниже ... ):
karma::generate(out, *karma::big_dword, data);
// ...
qi::parse(begin, end, *qi::big_dword, clone);
Повышение сериализации
Наилучшей производительности можно достичь, когдаиспользование ускоренной сериализации в двоичном режиме:
#include <sstream>
#include <boost/archive/binary_oarchive.hpp>
#include <boost/archive/binary_iarchive.hpp>
#include <boost/serialization/vector.hpp>
int main()
{
std::vector<int> data = make_testdata();
std::stringstream ss;
{
boost::archive::binary_oarchive oa(ss);
oa << data;
}
std::vector<int> clone;
{
boost::archive::binary_iarchive ia(ss);
ia >> clone;
}
//verify that clone now contains the original random data:
//bool ok = std::equal(data.begin(), data.end(), clone.begin());
return 0;
}
Testdata
(, общий дляВсе версии выше )
#include <boost/random.hpp>
// generates a deterministic pseudo-random vector of 32Mio ints
std::vector<int> make_testdata()
{
std::vector<int> testdata;
testdata.resize(2 << 24);
std::generate(testdata.begin(), testdata.end(), boost::mt19937(0));
return testdata;
}
Тесты
Я тестировал его по
- , используя входные данные
2<<24
(33554432) случайных целых чисел - не отображает вывод (мы не хотим измерять производительность прокрутки нашего терминала)
- приблизительные значения времени были
- Версия только для STL не так уж плоха на самом деле в 12.6s
- Текстовая версия Карма / Ци пробежала в 18 с 5,1 с , благодаря подсказке Арлена в
generate_delimited
:) - Двоичная версия кармы / ци (big_dword) всего за 1.4 с ( примерно 12x в 3-4 раза быстрее )
- Повышенная сериализация занимает около 0,8 с (или при замене текстовых архивов вместо двоичных файлов, около 13 с)