Шестнадцатеричные цифры очень легко конвертировать в двоичные:
// C++98 guarantees that '0', '1', ... '9' are consecutive.
// It only guarantees that 'a' ... 'f' and 'A' ... 'F' are
// in increasing order, but the only two alternative encodings
// of the basic source character set that are still used by
// anyone today (ASCII and EBCDIC) make them consecutive.
unsigned char hexval(unsigned char c)
{
if ('0' <= c && c <= '9')
return c - '0';
else if ('a' <= c && c <= 'f')
return c - 'a' + 10;
else if ('A' <= c && c <= 'F')
return c - 'A' + 10;
else abort();
}
Итак, вся строка выглядит примерно так:
void hex2ascii(const string& in, string& out)
{
out.clear();
out.reserve(in.length() / 2);
for (string::const_iterator p = in.begin(); p != in.end(); p++)
{
unsigned char c = hexval(*p);
p++;
if (p == in.end()) break; // incomplete last digit - should report error
c = (c << 4) + hexval(*p); // + takes precedence over <<
out.push_back(c);
}
}
Вы могли бы разумно спросить, почему так поступить, когда есть strtol
, и использовать его значительно меньше кода (как в ответе Джеймса Керрана). Хорошо, этот подход на медленнее на полный десятичный порядок медленнее, потому что он копирует каждый двухбайтовый фрагмент (возможно, выделяя кучу памяти для этого), а затем вызывает общую процедуру преобразования текста в число, которая не может быть написано так же эффективно, как специализированный код выше. Подход Кристиана (с использованием istringstream) в пять раз медленнее, чем , что . Вот эталонный график - вы можете различить разницу даже с небольшим блоком данных для декодирования, и он становится явным по мере увеличения различий. (Обратите внимание, что обе оси находятся в логарифмическом масштабе.)
Это преждевременная оптимизация? Конечно нет. Это та операция, которую запихивают в рутину библиотеки, о которой забывают, а затем вызывают тысячи раз в секунду. Это нужно кричать. Несколько лет назад я работал над проектом, в котором очень интенсивно использовались контрольные суммы SHA1 - мы получили ускорение на 10-20% для обычных операций, сохраняя их в виде необработанных байтов вместо шестнадцатеричных, преобразовывая их только тогда, когда нам нужно было показать их пользователь - и это было с функциями преобразования, которые уже были настроены на смерть. Кто-то может честно предпочесть краткость производительности здесь, в зависимости от того, что является более сложной задачей, но если это так, с какой стати вы кодируете на C ++?
Кроме того, с педагогической точки зрения я думаю, что было бы полезно показать примеры, написанные вручную, для решения этой проблемы; он показывает больше о том, что должен делать компьютер.