Я только что протестировал это сам, используя gcc 4.6.1-1 в Debian (после добавления typedef void *LPVOID
). Нет никакой разницы; оба выполняются мгновенно, даже без какой-либо оптимизации.
Я увеличил длину массива до 1048576, чтобы получить измеримое время выполнения (0,161 с), которое было одинаковым для IA32 и AMD64. Я включил оптимизацию (-O3), и время осталось прежним, но уменьшилось до 0,157 с. -Os (оптимизировать по размеру) имели тот же результат.
Возможно, вы использовали разные варианты сборки, например, у вас на AMD64 включена какая-то отладка доступа к памяти?