Мы пишем алгоритм обработки изображений, ориентированный на некоторые аппаратные средства Intel.Как правило, мы предпочитаем общие реализации C, но мы определили алгоритм, который по своей сути выполняет тонну дискретных косинусных преобразований (DCT), который работает очень хорошо.К сожалению, наши требования к пропускной способности таковы, что общая реализация C примерно на 2 порядка медленнее.Я могу получить один порядок величины с помощью некоторых других приемов, поэтому, если я смогу улучшить свои DCT примерно на порядок, у меня будет путь к успеху.
Является ли Intel MMX способом получить аппаратное ускорение доделать эти DCT?Есть ли другие специфичные для Intel библиотеки и / или аппаратные средства, которые я могу использовать, чтобы ускорить этих плохих парней?
Где мне начать искать?Для меня это новая работа, и я впервые усердно копаюсь в аппаратном обеспечении Intel, поэтому любые указатели будут наиболее ценными.