Я думаю, вы неправильно поняли, когда полезно использовать SSE. Но я использовал только SSE с типами с плавающей точкой, поэтому мой опыт может быть неприменим к этому случаю. Я надеюсь, что вы все еще можете извлечь некоторые уроки из того, что я написал.
SSE предоставляет SIMD, единую инструкцию для нескольких данных. Это полезно, когда у вас много значений, для которых вы хотите выполнить один и тот же расчет. Это своего рода мелкомасштабное распараллеливание. Таким образом, вместо одного умножения вы можете делать четыре одновременно. Но это полезно, только если у вас есть все доступные зависимости.
Так что в вашем случае нет места для распараллеливания. Вы могли бы написать функцию, которая вычисляла бы куб из четырех float
с, что было бы быстрее, чем вызывать функцию, которая вычисляла куб из одного числа четыре раза.