Мой любимый пример - алгоритм обмена * XOR :
// swap these two values:
int x = 4;
int y = 2;
// original:
int temp = x;
x = y;
y = temp;
// optimized version:
x ^= y;
y ^= x;
x ^= y;
Да, он не использует временную переменную и обычно может быть выполнен за три такта процессора, но это точно не очевидно, что он делает!