Анализ производительности
Примечание: новый лидер с 2015-08-20.
Я выполнил каждый из различных методов преобразования через некоторое грубое Stopwatch
тестирование производительности, прогон со случайным предложением (n = 61, 1000 итераций) и прогон с текстом Project Gutenburg (n = 1 238 957, 150 итераций) , Вот результаты, примерно от самого быстрого до самого медленного. Все измерения даны в тиках ( 10000 тиков = 1 мс ), и все относительные ноты сравниваются с [самой медленной] реализацией StringBuilder
. Используемый код см. Ниже или инфраструктура тестирования repo , где я сейчас поддерживаю код для запуска этого.
Ответственность
ВНИМАНИЕ: не полагайтесь на эти характеристики для чего-то конкретного; это просто пример пробных данных. Если вам действительно нужна первоклассная производительность, протестируйте эти методы в среде, представляющей ваши производственные потребности, с данными, указывающими, что вы будете использовать.
Результаты
- Поиск по байту
unsafe
(через CodesInChaos) (добавлено в тестовое репо airbreather )
- Текст: 4 727,85 (105,2X)
- Предложение: 0,28 (99,7X)
- Поиск по байту (через CodesInChaos)
- Текст: 10 853,96 (в 45,8 раза быстрее)
- Предложение: 0,65 (в 42,7 раза быстрее)
- Манипуляция байтами 2 (через CodesInChaos)
- Текст: 12 967,69 (в 38,4 раза быстрее)
- Предложение: 0,73 (в 37,9 раза быстрее)
- Манипуляция байтами (через Валида Эйссу)
- Текст: 16 856,64 (в 29,5 раз быстрее)
- Предложение: 0,70 (в 39,5 раза быстрее)
- Lookup / Shift (через Натана Моинвазири)
- Текст: 23 201,23 (в 21,4 раза быстрее)
- Предложение: 1,24 (в 22,3 раза быстрее)
- Поиск по клеву (через Брайана Ламберта)
- Текст: 23 879,41 (в 20,8 раза быстрее)
- Предложение: 1,15 (в 23,9 раза быстрее)
BitConverter
(через Томалак)
- Текст: 113 269,34 (в 4,4 раза быстрее)
- Приговор: 9,98 (в 2,8 раза быстрее)
{SoapHexBinary}.ToString
(через Майкрофт)
- Текст: 178 601,39 (в 2,8 раза быстрее)
- Приговор: 10,68 (в 2,6 раза быстрее)
{byte}.ToString("X2")
(с использованием foreach
) (получено из ответа Уилла Дина)
- Текст: 308 805,38 (в 2,4 раза быстрее)
- Приговор: 16,89 (в 2,4 раза быстрее)
{byte}.ToString("X2")
(с использованием {IEnumerable}.Aggregate
, требуется System.Linq) (через Mark)
- Текст: 352 828,20 (в 2,1 раза быстрее)
- Приговор: 16,87 (в 2,4 раза быстрее)
Array.ConvertAll
(с использованием string.Join
) (через Уилла Дина)
- Текст: 675 451,57 (в 1,1 раза быстрее)
- Приговор: 17,95 (в 2,2 раза быстрее)
Array.ConvertAll
(с использованием string.Concat
, требуется .NET 4.0) (через Уилла Дина)
- Текст: 752 078,70 (в 1,0 раза быстрее)
- Приговор: 18,28 (в 2,2 раза быстрее)
{StringBuilder}.AppendFormat
(с использованием foreach
) (через Томалак)
- Текст: 672 115,77 (в 1,1 раза быстрее)
- Предложение: 36,82 (в 1,1 раза быстрее)
{StringBuilder}.AppendFormat
(с использованием {IEnumerable}.Aggregate
, требуется System.Linq) (получено из ответа Томалака)
- Текст: 718 380,63 (в 1,0 раза быстрее)
- Приговор: 39,71 (в 1,0 раза быстрее)
Таблицы поиска взяли на себя инициативу по манипулированию байтами. По сути, существует некоторая форма предварительного вычисления того, каким будет любой заданный кусочек или байт в шестнадцатеричном виде. Затем, когда вы просматриваете данные, вы просто просматриваете следующую часть, чтобы увидеть, какой это будет шестнадцатеричная строка. Это значение затем добавляется к полученному выводу строки некоторым способом. В течение долгого времени манипулирование байтами, потенциально трудное для чтения некоторыми разработчиками, было наиболее эффективным подходом.
Ваша лучшая ставка по-прежнему будет найти некоторые репрезентативные данные и опробовать их в производственной среде. Если у вас другие ограничения памяти, вы можете предпочесть метод с меньшим количеством выделений, чем метод, который был бы быстрее, но потреблял бы больше памяти.
Тестовый код
Не стесняйтесь играть с кодом тестирования, который я использовал. Версия включена сюда, но вы можете клонировать repo и добавлять свои собственные методы. Пожалуйста, отправьте запрос на удаление, если вы найдете что-нибудь интересное или хотите помочь улучшить используемую им инфраструктуру тестирования.
- Добавить новый статический метод (
Func<byte[], string>
) в /Tests/ConvertByteArrayToHexString/Test.cs.
- Добавьте имя этого метода к возвращаемому значению
TestCandidates
в том же классе.
- Убедитесь, что вы используете нужную вам версию ввода, предложение или текст, переключая комментарии в
GenerateTestInput
в том же классе.
- Нажмите F5 и дождитесь вывода (в папке / bin также создается дамп HTML).
static string ByteArrayToHexStringViaStringJoinArrayConvertAll(byte[] bytes) {
return string.Join(string.Empty, Array.ConvertAll(bytes, b => b.ToString("X2")));
}
static string ByteArrayToHexStringViaStringConcatArrayConvertAll(byte[] bytes) {
return string.Concat(Array.ConvertAll(bytes, b => b.ToString("X2")));
}
static string ByteArrayToHexStringViaBitConverter(byte[] bytes) {
string hex = BitConverter.ToString(bytes);
return hex.Replace("-", "");
}
static string ByteArrayToHexStringViaStringBuilderAggregateByteToString(byte[] bytes) {
return bytes.Aggregate(new StringBuilder(bytes.Length * 2), (sb, b) => sb.Append(b.ToString("X2"))).ToString();
}
static string ByteArrayToHexStringViaStringBuilderForEachByteToString(byte[] bytes) {
StringBuilder hex = new StringBuilder(bytes.Length * 2);
foreach (byte b in bytes)
hex.Append(b.ToString("X2"));
return hex.ToString();
}
static string ByteArrayToHexStringViaStringBuilderAggregateAppendFormat(byte[] bytes) {
return bytes.Aggregate(new StringBuilder(bytes.Length * 2), (sb, b) => sb.AppendFormat("{0:X2}", b)).ToString();
}
static string ByteArrayToHexStringViaStringBuilderForEachAppendFormat(byte[] bytes) {
StringBuilder hex = new StringBuilder(bytes.Length * 2);
foreach (byte b in bytes)
hex.AppendFormat("{0:X2}", b);
return hex.ToString();
}
static string ByteArrayToHexViaByteManipulation(byte[] bytes) {
char[] c = new char[bytes.Length * 2];
byte b;
for (int i = 0; i < bytes.Length; i++) {
b = ((byte)(bytes[i] >> 4));
c[i * 2] = (char)(b > 9 ? b + 0x37 : b + 0x30);
b = ((byte)(bytes[i] & 0xF));
c[i * 2 + 1] = (char)(b > 9 ? b + 0x37 : b + 0x30);
}
return new string(c);
}
static string ByteArrayToHexViaByteManipulation2(byte[] bytes) {
char[] c = new char[bytes.Length * 2];
int b;
for (int i = 0; i < bytes.Length; i++) {
b = bytes[i] >> 4;
c[i * 2] = (char)(55 + b + (((b - 10) >> 31) & -7));
b = bytes[i] & 0xF;
c[i * 2 + 1] = (char)(55 + b + (((b - 10) >> 31) & -7));
}
return new string(c);
}
static string ByteArrayToHexViaSoapHexBinary(byte[] bytes) {
SoapHexBinary soapHexBinary = new SoapHexBinary(bytes);
return soapHexBinary.ToString();
}
static string ByteArrayToHexViaLookupAndShift(byte[] bytes) {
StringBuilder result = new StringBuilder(bytes.Length * 2);
string hexAlphabet = "0123456789ABCDEF";
foreach (byte b in bytes) {
result.Append(hexAlphabet[(int)(b >> 4)]);
result.Append(hexAlphabet[(int)(b & 0xF)]);
}
return result.ToString();
}
static readonly uint* _lookup32UnsafeP = (uint*)GCHandle.Alloc(_Lookup32, GCHandleType.Pinned).AddrOfPinnedObject();
static string ByteArrayToHexViaLookup32UnsafeDirect(byte[] bytes) {
var lookupP = _lookup32UnsafeP;
var result = new string((char)0, bytes.Length * 2);
fixed (byte* bytesP = bytes)
fixed (char* resultP = result) {
uint* resultP2 = (uint*)resultP;
for (int i = 0; i < bytes.Length; i++) {
resultP2[i] = lookupP[bytesP[i]];
}
}
return result;
}
static uint[] _Lookup32 = Enumerable.Range(0, 255).Select(i => {
string s = i.ToString("X2");
return ((uint)s[0]) + ((uint)s[1] << 16);
}).ToArray();
static string ByteArrayToHexViaLookupPerByte(byte[] bytes) {
var result = new char[bytes.Length * 2];
for (int i = 0; i < bytes.Length; i++)
{
var val = _Lookup32[bytes[i]];
result[2*i] = (char)val;
result[2*i + 1] = (char) (val >> 16);
}
return new string(result);
}
static string ByteArrayToHexViaLookup(byte[] bytes) {
string[] hexStringTable = new string[] {
"00", "01", "02", "03", "04", "05", "06", "07", "08", "09", "0A", "0B", "0C", "0D", "0E", "0F",
"10", "11", "12", "13", "14", "15", "16", "17", "18", "19", "1A", "1B", "1C", "1D", "1E", "1F",
"20", "21", "22", "23", "24", "25", "26", "27", "28", "29", "2A", "2B", "2C", "2D", "2E", "2F",
"30", "31", "32", "33", "34", "35", "36", "37", "38", "39", "3A", "3B", "3C", "3D", "3E", "3F",
"40", "41", "42", "43", "44", "45", "46", "47", "48", "49", "4A", "4B", "4C", "4D", "4E", "4F",
"50", "51", "52", "53", "54", "55", "56", "57", "58", "59", "5A", "5B", "5C", "5D", "5E", "5F",
"60", "61", "62", "63", "64", "65", "66", "67", "68", "69", "6A", "6B", "6C", "6D", "6E", "6F",
"70", "71", "72", "73", "74", "75", "76", "77", "78", "79", "7A", "7B", "7C", "7D", "7E", "7F",
"80", "81", "82", "83", "84", "85", "86", "87", "88", "89", "8A", "8B", "8C", "8D", "8E", "8F",
"90", "91", "92", "93", "94", "95", "96", "97", "98", "99", "9A", "9B", "9C", "9D", "9E", "9F",
"A0", "A1", "A2", "A3", "A4", "A5", "A6", "A7", "A8", "A9", "AA", "AB", "AC", "AD", "AE", "AF",
"B0", "B1", "B2", "B3", "B4", "B5", "B6", "B7", "B8", "B9", "BA", "BB", "BC", "BD", "BE", "BF",
"C0", "C1", "C2", "C3", "C4", "C5", "C6", "C7", "C8", "C9", "CA", "CB", "CC", "CD", "CE", "CF",
"D0", "D1", "D2", "D3", "D4", "D5", "D6", "D7", "D8", "D9", "DA", "DB", "DC", "DD", "DE", "DF",
"E0", "E1", "E2", "E3", "E4", "E5", "E6", "E7", "E8", "E9", "EA", "EB", "EC", "ED", "EE", "EF",
"F0", "F1", "F2", "F3", "F4", "F5", "F6", "F7", "F8", "F9", "FA", "FB", "FC", "FD", "FE", "FF",
};
StringBuilder result = new StringBuilder(bytes.Length * 2);
foreach (byte b in bytes) {
result.Append(hexStringTable[b]);
}
return result.ToString();
}
Обновление (2010-01-13)
Добавлен ответ Валида на анализ. Довольно быстро.
Обновление (2011-10-05)
Добавлен string.Concat
Array.ConvertAll
вариант для полноты (требуется .NET 4.0). Наравне с string.Join
версией.
Обновление (2012-02-05)
Тестовое репо включает в себя больше вариантов, таких как StringBuilder.Append(b.ToString("X2"))
. Никто не расстроил результаты какие-либо. Например, foreach
быстрее, чем {IEnumerable}.Aggregate
, но BitConverter
все еще выигрывает.
Обновление (2012-04-03)
Добавлен ответ Майкрофта SoapHexBinary
на анализ, который занял третье место.
Обновление (2013-01-15)
Добавлен ответ CodesInChaos на манипулирование байтами, который занял первое место (с большим полем для больших блоков текста).
Обновление (2013-05-23)
Добавлен ответ поиска Натана Моинвазири и вариант из блога Брайана Ламберта. Оба довольно быстрые, но не идут впереди на тестовой машине, которую я использовал (AMD Phenom 9750).
Обновление (2014-07-31)
Добавлен новый байтовый ответ @ CodesInChaos. Похоже, что он взял на себя инициативу как по тестам предложений, так и по полнотекстовым тестам.
Обновление (2015-08-20)
Добавлено оптимизация airbreather и unsafe
вариант к этому репо ответа . Если вы хотите играть в небезопасную игру, вы можете получить огромный выигрыш в производительности по сравнению с любым из предыдущих лучших победителей как по коротким строкам, так и по крупным текстам.