Цель здесь - написать чистый код, чтобы оптимизатор распознал операцию. Вероятно, он знает о ffs
и о том, когда его использовать.
Помогает массив фиксированного размера, он дает константы в цикле, что облегчает развертывание. Выравнивание также выглядит в вашу пользу.