Я хотел сделать свои первые шаги с Intel SSE, поэтому я следовал руководству, опубликованному здесь , с той разницей, что вместо разработки для Windows и C ++ я делаю это для Linux и C (поэтому я не Не используйте _aligned_malloc
, но posix_memalign
).
Я также реализовал один вычислительный метод без использования расширений SSE. Удивительно, но когда я запускаю программу, оба куска кода (тот, что с SSE, и тот, у кого нет) занимают одинаковое количество времени для запуска, обычно это время, когда один использует SSE немного выше, чем другой.
Это нормально? Возможно ли, что GCC уже оптимизирует с SSE (также используя опцию -O0
)? Я также попробовал вариант -mfpmath=387
, но никак не изменился.