На этот вопрос дан частичный ответ Целочисленные вычисления на графическом процессоре
Короче говоря, современные графические процессоры имеют эквивалентную производительность INT и FP для 32-битных данных.Таким образом, ваши логические операции будут выполняться с той же скоростью.
С точки зрения программирования вы потеряете производительность, если будете работать с целочисленными данными SCALAR.Графические процессоры любят работать с ПАРАЛЛЕЛЬНЫМИ и ПАКЕТНЫМИ операциями.
for(int i=0; i<LEN_VEC4; i++)
VEC4[i] = VEC4[i] * VEC4[i]; // (x,y,z,w) * (x,y,z,w)
Если вы делаете что-то вроде ...
for(int i=0; i<LEN_VEC4; i++)
VEC4[i].w = (VEC4[i].x & 0xF0F0F0F0) | (VEC4[i].z ^ 0x0F0F0F0F) ^ VEC4[i].w;
... выполняя множество различных операций над элементами одного и того же вектора, вы столкнетесь с проблемами производительности.