Честно говоря, я думаю, что CS 4.x довольно ограничен из-за отсутствия атомарности, двойной точности, ограничений на доступ к групповой общей памяти, а также ограничения в 16 КБ. Также вы можете иметь только один БПЛА, который может быть связан.
Я полагаю, что большинство разработчиков DirectCompute будут использовать CS 4.x для постобработки в играх или около того (вероятно, с путями кода CS 4.x и CS 5.0). Люди, которые хотят выполнять тяжелую работу с GPGPU, будут учиться с CS 4.x, а затем переходят на CS 5.0.
Теперь вы говорите, что понятия не имеете об ограничениях CS 4.x. Я предлагаю пойти с CS 4.x и придерживаться его пока.
Но на самом деле все зависит от того, что вы разрабатываете, как и от вашей целевой аудитории (профессиональный разработчик против хобби-программиста, доставка вашего приложения сейчас через два года, основная аудитория против профессионального рынка и т.д.)