Алгоритмы, которые вы описываете, не являются ни простыми, ни вводными с точки зрения программирования на GPU. Причина того, что у CUDA есть примеры в этих областях, заключается в том, что они были достаточно длинными, чтобы люди разработали эти примеры. В настоящее время нет общедоступной версии OpenCL, работающей на графических процессорах. И ATI, и NVIDIA предлагают бета-версии своих драйверов OpenCL, но ATI поддерживает только вычисления процессора, а NVIDIA требует подписания NDA, чтобы получить. Проще говоря, OpenCL существовал недостаточно долго для разработки и демонстрации таких всеобъемлющих примеров.
Тем не менее, получить доступ к драйверам NVIDIA OpenCL не сложно. Вы можете узнать, как это сделать на их форумах здесь . Я предполагаю, что дистрибутив OpenCL содержит несколько примеров программ, которые помогут вам начать работу.
Это также означает, что для вас это отличная возможность разработать некоторые из этих тестов и опубликовать свои результаты. Тогда люди будут ссылаться на вашу работу, а не вы ссылаетесь на их работу. Я не ожидал бы слишком много сюрпризов, хотя. Производительность OpenCL должна примерно соответствовать производительности CUDA, как только она станет широко доступной и поддерживаемой.