Кто-нибудь имел опыт использования инструкций предварительной выборки для процессора Core 2 Duo?
Я успешно использовал (стандартный?) Набор предварительной выборки (prefetchnta
, prefetcht1
и т. Д.) Для серии компьютеров P4, но при запуске кода на Core 2 Duo кажется, что * Инструкции 1005 * ничего не делают, а инструкция prefetchnta
менее эффективна.
Моими критериями для оценки производительности являются результаты синхронизации для операции вектор-вектор BLAS 1 (axpy), когда размер вектора достаточно велик для поведения вне кэша.
Ввели ли Intel новые инструкции по предварительной выборке?