Быстрее где? на процессоре? Объем работы для полноэкранного четырехъядерного процессора незначителен по сравнению с работой, необходимой для работы на графическом процессоре.
Так что в данном случае важнее всего, как правило, оптимизировать сторону графического процессора, и, верите вы этому или нет, есть одна вещь, которая довольно важна. Все известные мне графические процессоры конвертируют четырехугольник в 2 треугольника. Каждый из этих треугольников растеризуется отдельно. Так получилось, что в итоге вы не используете графический процессор в полном объеме, потому что на диагонали между двумя треугольниками графический процессор должен будет работать дважды (это потому, что графический процессор работает обычно на 16 или 32 пикселях одновременно, в форме квадрат или прямоугольник. Минимум 4, что уже делает дополнительную работу).
Как избежать этой дополнительной работы на грани? Нарисуйте один треугольник над всей областью и ножницами в области, в которую хотите нарисовать.
Что-то вроде (хотя я обычно иду от 0 до 1, а не от -1 до 1 ...):
glBegin(GL_TRIANGLES);
glVertex(-1,-1,0); glVertex(3,-1,0); Vertex(-1,3,0);
glEnd();