Производительность Intel FFT - PullRequest
4 голосов
/ 30 июля 2011

Какой процессор будет работать лучше, i5-2500K или i7-960 , относительно определенных операций FFT в секунду, например: сложное FFT на месте при длине буфера 16k?

Я спрашиваю об этом, потому что я хотел бы насытить все ядра и все потоки, а поскольку у i7 8 потоков, а у i5 только 4, моя главная проблема заключается в том, чтобы инструкции SSE могли выполняться параллельно на всех 8 логических потоках.

Ответы [ 2 ]

4 голосов
/ 30 июля 2011

Этот тест http://ixbtlabs.com/articles3/cpu/ci7-turbo-ht-p1.html?pages=ci7-turbo-ht-p1.html

показывает, что выигрыш от включения HT на i7 составил 0% для FFT. (Таблица научных приложений, строка БПФ). БПФ был от MATLAB (основан на библиотеке под названием FFTW).

i7-960 имеет 4 ядра и 8 потоков от HyperThreading (HT). Как показал ixbt, HT не поможет вычислить больше FFT, поэтому я рекомендую вам купить более новый i5-2500 с теми же четырьмя ядрами, но с большей частотой, большим турбонаддувом (динамический разгон) и более новой технологией.

Кроме того, этот i5 имеет следующую микроархитектуру (SNB - Sandy Bridge) и имеет AVX (вдвое больше FLOPS на ГГц). Если FFT может использовать его (использовать современную библиотеку и современный компилятор), он должен почти удвоить производительность FFT (если мы не будем рассматривать ограничения памяти и памяти). Intel говорит, что их новый MKL вырос в 1,8 раза по сравнению с AVX: http://software.intel.com/en-us/articles/intel-avx-optimization-in-intel-mkl-v103/

Ускорение AVX / NHM (с поддержкой AVX через Nehalem NHM) составляет 1,8x для 1F CFFT с поддержкой radix-2 с N = 1024

Итак, i5-2500 лучше в 1,8 раза за такт от AVX, он имеет чуть больше ГГц (как у spec, так и TurboBoost) и поддерживает более быструю память (DDR3-1066 для NHM и DDR3-1333 для i5 SND) .

0 голосов
/ 30 июля 2011

Я бы сказал, нет, одна из особенностей i7, имеющего 8 потоков, заключается в том, что во время переключения контекста (что будет происходить чаще из-за логических ядер) состояние FPU НЕ СОХРАНЯЕТСЯ, поэтому это означает, что после возобновления операции FPU оно имеетповторно заполнить структуры FPU, чтобы он мог завершить операцию.Из того, что я могу сказать, i5-2500k будет делать это быстрее, поскольку потоки конкурируют только за ядро, а не с более высоким уровнем конкуренции за использование FPU (которых только 4).

PS: я мог бы, возможно,ошибаюсь, так как я не уверен в специфике 960, но это то, что я нашел из некоторых работ, которые я проделал в прошлом.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...