С http://graphics.stanford.edu/~seander/bithacks.html#CountBitsSetParallel
unsigned int v; // count bits set in this (32-bit value)
unsigned int c; // store the total here
c = v - ((v >> 1) & 0x55555555);
c = ((c >> 2) & 0x33333333) + (c & 0x33333333);
c = ((c >> 4) + c) & 0x0F0F0F0F;
c = ((c >> 8) + c) & 0x00FF00FF;
c = ((c >> 16) + c) & 0x0000FFFF;
Редактировать: правда, он немного оптимизирован, что затрудняет чтение. Проще читать как:
c = (v & 0x55555555) + ((v >> 1) & 0x55555555);
c = (c & 0x33333333) + ((c >> 2) & 0x33333333);
c = (c & 0x0F0F0F0F) + ((c >> 4) & 0x0F0F0F0F);
c = (c & 0x00FF00FF) + ((c >> 8) & 0x00FF00FF);
c = (c & 0x0000FFFF) + ((c >> 16)& 0x0000FFFF);
Каждый шаг из этих пяти добавляет соседние биты в группы по 1, затем 2, затем 4 и т. Д.
Метод основан на разделяй и властвуй.
На первом этапе мы складываем биты 0 и 1 и помещаем результат в двухбитный сегмент 0-1, добавляем биты 2 и 3 и помещаем результат в двухбитный сегмент 2-3 и т. Д. 1010 *
На втором шаге мы складываем два бита 0-1 и 2-3 и помещаем результат в четырехбитовый 0-3, складываем два бита 4-5 и 6-7 и помещаем результат в 4-битные 4-7 и т. д. ...
Пример:
So if I have number 395 in binary 0000000110001011 (0 0 0 0 0 0 0 1 1 0 0 0 1 0 1 1)
After the first step I have: 0000000101000110 (0+0 0+0 0+0 0+1 1+0 0+0 1+0 1+1) = 00 00 00 01 01 00 01 10
In the second step I have: 0000000100010011 ( 00+00 00+01 01+00 01+10 ) = 0000 0001 0001 0011
In the fourth step I have: 0000000100000100 ( 0000+0001 0001+0011 ) = 00000001 00000100
In the last step I have: 0000000000000101 ( 00000001+00000100 )
, что равно 5, что является правильным результатом