Текстуры могут быть быстрее, с той же скоростью или медленнее, чем «открытый» доступ к глобальной памяти. Не существует общих практических правил для прогнозирования производительности с использованием текстур, поскольку ускорение (или отсутствие ускорения) определяется шаблонами использования данных в вашем коде и используемым аппаратным обеспечением текстуры.
В худшем случае, когда частота попаданий в кэш очень низкая, использование текстур медленнее, чем при обычном доступе к памяти. Каждый поток должен сначала пропустить кеш, а затем вызвать глобальную выборку памяти. В результате общая задержка будет выше, чем при прямом чтении из памяти. Я почти всегда пишу две версии любого серьезного кода, который я разрабатываю, где текстуры могут быть полезны (одна с, а другая без), а затем проверяю их. Часто можно разработать эвристику, чтобы выбрать, какую версию использовать на основе входных данных. CUBLAS широко использует эту стратегию.