Как уже говорили другие, это произвольное соглашение.Но вот как это происходит естественным образом и в OpenGL (не относится конкретно к XNA):
Если на мониторе отображается 2D-изображение, оно имеет координаты X и Y, а координата Y вверх (или, возможно,вниз).Если у вас есть это 2D-изображение, являющееся проекцией 3D-сцены, то вы получите координату Z;сохраняя преобразование координат настолько простым, насколько это возможно, Y все еще вверх (и Z направлен наружу).