Я думаю, что общее решение состоит в том, чтобы выяснить, где в мировом пространстве попадает нажатая координата, предполагая, что экран является плоскостью в мире (в местоположении камеры). Затем вы стреляете лучом, перпендикулярным плоскости, в вашу сцену.
Для этого требуется код "world-space", чтобы выяснить, с каким объектом (ами) пересекается луч; Решения, которые вы назвали неподходящими для OpenGL ES, основаны на изображениях, то есть зависят от пикселей, генерируемых при рендеринге сцены.