К сожалению, графический процессор не может выполнять PTX напрямую, он может выполнять только микрокод SASS. Поскольку JIT-компилятор в драйвере (который переводит PTX-> SASS) действительно имеет возможность существенно изменить код PTX во время компиляции, выполняя такие оптимизации, как устранение общих подвыражений, ваши наблюдения показывают, что 1) «трудно отслеживать отношения между регистрами PTX и регистрами SASS »и 2) вы не можете проверить регистры PTX во время выполнения, все слишком точно.
Я не ожидаю, что любое из этих ограничений будет снято в обозримом будущем.