Как включить чрезвычайно длинные литералы в исходный код C ++? - PullRequest
5 голосов
/ 20 марта 2010

У меня есть небольшая проблема. По сути, мне нужно хранить большой список записей из белого списка внутри моей программы, и я хотел бы включить такой список напрямую - я не хочу распространять другие библиотеки и тому подобное, и я не хочу встраивать строки в ресурс Win32 по ряду причин, в которые я не хочу сейчас вдаваться.

Я просто включил свой большой белый список в мой файл .cpp, и мне было выдано следующее сообщение об ошибке:

1>ServicesWhitelist.cpp(2807): fatal error C1091: compiler limit: string exceeds 65535 bytes in length

Сама строка примерно вдвое превышает это допустимое ограничение VC ++. Какой лучший способ включить такой большой литерал в программу?

EDIT:

Я храню строку следующим образом:

const std::wstring servicesWhitelist
(
 L".NETFRAMEWORK|"
 L"_IOMEGA_ACTIVE_DISK_SERVICE_|"
 L"{6080A529-897E-4629-A488-ABA0C29B635E}|"
 L"{834170A7-AF3B-4D34-A757-E05EB29EE96D}|"
 L"{85CCB53B-23D8-4E73-B1B7-9DDB71827D9B}|"
 L"{95808DC4-FA4A-4C74-92FE-5B863F82066B}|"
 L"{A7447300-8075-4B0D-83F1-3D75C8EBC623}|"
 L"{D31A0762-0CEB-444E-ACFF-B049A1F6FE91}|"
 L"{E2B953A6-195A-44F9-9BA3-3D5F4E32BB55}|"
 L"{EDA5F5D3-9E0F-4F4D-8A13-1D1CF469C9CC}|"
 L"2WIREPCP|"
//About 3800 more lines
);

EDIT2 Он используется во время выполнения таким образом:

static const boost::wregex servicesWhitelistRegex(servicesWhitelist);
std::wstring service;
//code to populate service
if (!boost::regex_match(service, servicesWhitelistRegex))
 //Do something to print service

Ответы [ 5 ]

8 голосов
/ 20 марта 2010

Как насчет массива? (вы должны ставить запятые только после законного ограничения для каждого элемента)

const std::wstring servicesWhitelist[] = {
 L".NETFRAMEWORK|",
 L"_IOMEGA_ACTIVE_DISK_SERVICE_|",
 L"{6080A529-897E-4629-A488-ABA0C29B635E}|",
 L"{834170A7-AF3B-4D34-A757-E05EB29EE96D}|",
 L"{85CCB53B-23D8-4E73-B1B7-9DDB71827D9B}|",
 L"{95808DC4-FA4A-4C74-92FE-5B863F82066B}|",
 L"{A7447300-8075-4B0D-83F1-3D75C8EBC623}|",
 L"{D31A0762-0CEB-444E-ACFF-B049A1F6FE91}|",
 L"{E2B953A6-195A-44F9-9BA3-3D5F4E32BB55}|",
 L"{EDA5F5D3-9E0F-4F4D-8A13-1D1CF469C9CC}|",
 L"2WIREPCP|",
...
};

Вы можете использовать приведенный ниже оператор для получения комбинированной строки.

accumulate(servicesWhitelist, servicesWhitelist+sizeof(servicesWhitelist)/sizeof(servicesWhitelist[0]), "")
4 голосов
/ 09 июля 2011

Предположим, вам на самом деле нужно хранить строку> 64 тыс. Символов (то есть все вышеперечисленные решения «просто не делайте этого» не применяются.)

Чтобы сделать MSVC счастливым, вместо того чтобы сказать:

const char *foo = "abcd...";

Вы можете преобразовать вашу> 64k символьную строку в отдельные символы, представленные в виде целых чисел:

const char foo[] = { 97, 98, 99, 100, ..., 0 };

Где каждая буква была преобразована в ее эквивалент ascii (97 == 'a' и т. Д.), И в конце добавлен терминатор NUL.

MSVC2010 по крайней мере доволен этим.

2 голосов
/ 20 марта 2010

Если это примерно вдвое больше предела, очевидно, что очевидным решением будет хранить 2 (или 3) таких строки. :) Я уверен, что ваш код, который читает их во время выполнения, может справиться с этим достаточно легко.

РЕДАКТИРОВАТЬ: Вам нужно по какой-то причине использовать регулярное выражение? Не могли бы вы разбить большие строки на список отдельных токенов и провести простое сравнение строк?

0 голосов
/ 28 апреля 2015

Я не претендую на кредит в этом:

https://social.msdn.microsoft.com/Forums/vstudio/en-US/c573db8b-c9cd-43d7-9f89-202ba9417296/fatal-error-c1091

Вместо этого используйте STL.

Фрагмент кода

#include <sstream>

std::ostringstream oss;

oss << myString1 << myString2 << myString3 << myString4;

oss.str () теперь возвращает экземпляр класса STL std :: string, а oss.str (). C_str () возвращает const char *

0 голосов
/ 12 апреля 2010

Ваша проблема может быть уменьшена до (в Python):

whitelist_services = { ".NETFRAMEWORK", "_IOMEGA_ACTIVE_DISK_SERVICE_" }
if service in whitelist_services:
   print service, "is a whitelisted service"

Прямой перевод на C ++ будет:

// g++ *.cc -std=c++0x && ./a.out
#include <iostream>
#include <unordered_set>

namespace {
  typedef const wchar_t* str_t;
  // or
  ////typedef std::wstring str_t;
  str_t servicesWhitelist[] = {
    L".NETFRAMEWORK",
    L"_IOMEGA_ACTIVE_DISK_SERVICE_",
  };
  const size_t N = sizeof(servicesWhitelist) / sizeof(*servicesWhitelist);

  // if you need to search for multiple services then a hash table
  // could speed searches up O(1). Otherwise std::find() on the array
  // might be sufficient O(N), or std::binary_search() on sorted array
  // O(log N) 
  const std::unordered_set<str_t> services
    (servicesWhitelist, servicesWhitelist + N);
}

int main() {
  str_t service = L".NETFRAMEWORK";
  if (services.find(service) != services.end())
    std::wcout << service << " is a whitelisted service" << std::endl;
}
...