Каковы наилучшие настройки для таких вещей, как MXCSR ? Какой режим округления самый быстрый? На...
Какой процессор будет работать лучше, i5-2500K или i7-960 , относительно определенных операций FFT...
У меня есть два вектора по 4 целых числа в каждом, и я хотел бы использовать команду SIMD для их...
В настоящее время я пытаюсь наиболее эффективно выполнить на месте умножение массива комплексных...
Я ищу выполнение операции shl(mult(var1,var2),1), где mult умножает var1 и var2 (оба являются...
Я только начинаю экспериментировать с добавлением OpenMP к некоторому коду SSE. Моя первая тестовая...
Я нашел эту строку в коде, сгенерированном компилятором MSVC из Visual Studio 2008, пытаясь...
Я смотрю спецификацию Intel: Архитектура Intel® 64 и IA-32 Руководство разработчика программного...
Можно ли использовать SSE для битовых манипуляций с данными, которые не выровнены по байту?...
Уже есть вопрос по этому вопросу, но он был закрыт как "неоднозначный", поэтому я открываю новый -...
У меня есть внутренний цикл, такой как этот for(i=0 ;i<n;i++){ x[0] += A[i] * z[0]; x[1] += A[i]...
Я пробовал свои силы в оптимизации некоторого кода, который я использую с помощью встроенных...
Мне интересно, почему следующий код с инструкциями SSE2 выполняет умножение медленнее, чем...
Сегодня я столкнулся с довольно странной проблемой.У меня есть математическая библиотека,...
Я использую Apple GCC 4.2.1 , и я наткнулся на странную проблему со следующим кодом ... Я всегда...
Я использую SSE2 в gcc 4.4.3. В моей программе мне нужно использовать, по меньшей мере, (0 - 7)...
Я хочу использовать версию хорошо известного алгоритма подсчета битов MIT для подсчета соседей в...
У меня есть этот фрагмент кода: @combinerows: mov esi,eax and edi,Row1Mask and ebx,Row2Mask or ebx...
Передача параметров в Visual Studio .Обратите внимание, как передаются __m128 типы.Означает ли это,...
Я работаю над оптимизацией алгоритма, используя инструкции SSE2.Но я столкнулся с этой проблемой,...
Мой вопрос короткий.Можно ли использовать новые sse-регистры из встроенного ассемблера Visual...
Я пытаюсь записать сжатие потока (взять массив и избавиться от пустых элементов) с использованием...
Мне нужно сравнить два буфера по частям на равенство. Мне не нужна информация о соотношении двух...
Допустим ли следующий код, чтобы проверить, поддерживает ли ЦП набор команд SSE3? Использование...
Как на C или C ++ написать код для добавления без знака двух массивов, которые, вероятно, будут...