/ 12 июля 2010

У меня есть std::vector<DOUBLEPOINT> Я подаю заявку с кривыми Безье, и результаты отображаются в режиме реального времени. Я конвертирую точки Безье в кучу коротких линий. Я храню координаты для маленьких линий в векторе выше. Вот моя проблема: Когда размер моего вектора превышает строку кэша, все становится очень медленным и очень быстрым. Мне было интересно, будет ли лучше иметь много std::vector<DOUBLEPOINT> и, в основном, каждые 100 баллов, он переключается на другой. Решит ли это мою проблему с кешем? В противном случае, как еще я мог бы позволить пользователю создавать столько точек, сколько нужно, не становясь очень-очень медленным? все мои другие алгоритмы быстро светятся (например, заполнение полигонов), так что это не мои проблемы. Что действительно тормозит, так это std :: vector.


    struct SHAPECONTOUR{

        std::vector<USERFPOINT> UserPoints;
        std::vector<DOUBLEPOINT> DrawingPoints;

        SHAPEOUTLINE Outline;


I call UpdateShape() every time a point is added but I assure you my other algorithms are fast...

void OGLSHAPE::UpdateShape()
    if(Contour.size() == 0)
    for(int i = 0; i < Contour.size(); ++i)

     if(Contour[i].UserPoints.size() < 2)

     for(unsigned int x = 0; x < Contour[i].UserPoints.size() - 1; ++x)
             Contour[i].UserPoints[x + 1],

     //Remove Duplicates
     for(int j = 0; j < 2; ++j)
         if(Contour[i].DrawingPoints.size() > 2)
             for(unsigned int x = 0; x < Contour[i].DrawingPoints.size() - 1; ++x)
                 if(Contour[i].DrawingPoints[x].point[0] ==
                     Contour[i].DrawingPoints[x + 1].point[0] &&
                     Contour[i].DrawingPoints[x].point[1] ==
                     Contour[i].DrawingPoints[x + 1].point[1] 

                     Contour[i].DrawingPoints.erase(Contour[i].DrawingPoints.begin() + x);

     Contour[i].Outline.OutlineSize = OutlineVec.size()  / 2;
     glBufferDataARB(GL_ARRAY_BUFFER_ARB,sizeof(GLfloat) * OutlineVec.size(),&OutlineVec[0],GL_STATIC_COPY);


    gluTessNormal(PolygonTesselator.tobj, 0, 0, 1);


    for(unsigned int c = 0; c < Contour.size(); ++c)

            for(unsigned int j = 0; j < Contour[c].DrawingPoints.size(); ++j)




void OGLSHAPE::SetCubicBezier(USERFPOINT &a,USERFPOINT &b, int &currentcontour )

        double dx1 = a.RightHandle.x - a.UserPoint.x;
        double dy1 = a.RightHandle.y - a.UserPoint.y;
        double dx2 = b.LeftHandle.x - a.RightHandle.x;
        double dy2 = b.LeftHandle.y - a.RightHandle.y;
        double dx3 = b.UserPoint.x - b.LeftHandle.x;
        double dy3 = b.UserPoint.y - b.LeftHandle.y;

        float len = sqrt(dx1 * dx1 + dy1 * dy1) + 
            sqrt(dx2 * dx2 + dy2 * dy2) + 
            sqrt(dx3 * dx3 + dy3 * dy3);

        int NUM_STEPS =  int(len * 0.049);

        if(NUM_STEPS > 55)
            NUM_STEPS = 55;
        double subdiv_step  = 1.0 / (NUM_STEPS + 1);
        double subdiv_step2 = subdiv_step*subdiv_step;
        double subdiv_step3 = subdiv_step*subdiv_step*subdiv_step;

        double pre1 = 3.0 * subdiv_step;
        double pre2 = 3.0 * subdiv_step2;
        double pre4 = 6.0 * subdiv_step2;
        double pre5 = 6.0 * subdiv_step3;

        double tmp1x = a.UserPoint.x - a.RightHandle.x * 2.0 + b.LeftHandle.x;
        double tmp1y = a.UserPoint.y - a.RightHandle.y  * 2.0 + b.LeftHandle.y;

        double tmp2x = (a.RightHandle.x - b.LeftHandle.x)*3.0 - a.UserPoint.x + b.UserPoint.x;
        double tmp2y = (a.RightHandle.y - b.LeftHandle.y)*3.0 - a.UserPoint.y + b.UserPoint.y;

        temp.point[0] = a.UserPoint.x;
        temp.point[1] = a.UserPoint.y;

        //a user
        //a right
        //b left
        //b user

        double dfx = (a.RightHandle.x - a.UserPoint.x)*pre1 + tmp1x*pre2 + tmp2x*subdiv_step3;
        double dfy = (a.RightHandle.y - a.UserPoint.y)*pre1 + tmp1y*pre2 + tmp2y*subdiv_step3;

        double ddfx = tmp1x*pre4 + tmp2x*pre5;
        double ddfy = tmp1y*pre4 + tmp2y*pre5;

        double dddfx = tmp2x*pre5;
        double dddfy = tmp2y*pre5;

        int step = NUM_STEPS;

        // Suppose, we have some abstract object Polygon which
        // has method AddVertex(x, y), similar to LineTo in
        // many graphical APIs.
        // Note, that the loop has only operation add!


            temp.point[0]  += dfx;
            temp.point[1]  += dfy;
            dfx  += ddfx;
            dfy  += ddfy;
            ddfx += dddfx;
            ddfy += dddfy;


        temp.point[0] = (GLdouble)b.UserPoint.x;
        temp.point[1] = (GLdouble)b.UserPoint.y;


void OGLSHAPE::GenerateLinePoly(const std::vector<DOUBLEPOINT> &input, int width)
    if(input.size() < 2)

    float w = width / 2.0f;

    for( size_t i = 0; i < input.size()-1; ++i )
        POINTFLOAT cur;
        cur.x = input[i].point[0];
        cur.y = input[i].point[1];

        POINTFLOAT nxt;
        nxt.x = input[i+1].point[0];
        nxt.y = input[i+1].point[1];

        POINTFLOAT b;
        b.x = nxt.x - cur.x;
        b.y = nxt.y - cur.y;

        b = normalize(b);

        POINTFLOAT b_perp;
        b_perp.x = -b.y;
        b_perp.y = b.x;

        POINTFLOAT p0;
        POINTFLOAT p1;
        POINTFLOAT p2;
        POINTFLOAT p3;

        p0.x = cur.x + b_perp.x * w;
        p0.y = cur.y + b_perp.y * w;

        p1.x = cur.x - b_perp.x * w;
        p1.y = cur.y - b_perp.y * w;

        p2.x = nxt.x + b_perp.x * w;
        p2.y = nxt.y + b_perp.y * w;

        p3.x = nxt.x - b_perp.x * w;
        p3.y = nxt.y - b_perp.y * w;



        // only do joins when we have a prv
        if( i == 0 ) continue;

        POINTFLOAT prv;
        prv.x = input[i-1].point[0];
        prv.y = input[i-1].point[1];

        POINTFLOAT a;
        a.x = prv.x - cur.x;
        a.y = prv.y - cur.y;

        a = normalize(a);

        POINTFLOAT a_perp;
        a_perp.x = a.y;
        a_perp.y = -a.x;

        float det = a.x * b.y  - b.x * a.y;
        if( det > 0 )
            a_perp.x = -a_perp.x;
            a_perp.y = -a_perp.y;

            b_perp.x = -b_perp.x;
            b_perp.y = -b_perp.y;

        // TODO: do inner miter calculation

        // flip around normals and calculate round join points
        a_perp.x = -a_perp.x;
        a_perp.y = -a_perp.y;

        b_perp.x = -b_perp.x;
        b_perp.y = -b_perp.y;

        size_t num_pts = 4;

        std::vector< POINTFLOAT> round( 1 + num_pts + 1 );
        POINTFLOAT nc;
        nc.x = cur.x + (a_perp.x * w);
        nc.y = cur.y + (a_perp.y * w);

        round.front() = nc;

        nc.x = cur.x + (b_perp.x * w);
        nc.y = cur.y + (b_perp.y * w);

        round.back() = nc;

        for( size_t j = 1; j < num_pts+1; ++j )
            float t = (float)j/(float)(num_pts+1);
            if( det > 0 )
             POINTFLOAT nin;
             nin = slerp2d( b_perp, a_perp, 1.0f-t );
             nin.x *= w;
             nin.y *= w;

             nin.x += cur.x;
             nin.y += cur.y;

             round[j] = nin;
             POINTFLOAT nin;
             nin = slerp2d( a_perp, b_perp, t );
             nin.x *= w;
             nin.y *= w;

             nin.x += cur.x;
             nin.y += cur.y;

             round[j] = nin;

        for( size_t j = 0; j < round.size()-1; ++j )


            if( det > 0 )
             OutlineVec.push_back(round[j + 1].x);
             OutlineVec.push_back(round[j + 1].y);


             OutlineVec.push_back(round[j + 1].x);
             OutlineVec.push_back(round[j + 1].y);


Ответы [ 2 ]

/ 12 июля 2010

Возможно, это не корень вашей проблемы. Но вы можете попробовать использовать итераторы вместо индексации везде. Это может помочь компилятору принимать лучшие решения по оптимизации. std::for_each выглядит как возможный кандидат для этого, вы можете просто отложить на другую функцию, например:

void OGLSHAPE::real_update_shap(SHAPECONTOUR &contour) {
    if(contour.UserPoints.size() < 2) {
    // do your thing!

void OGLSHAPE::UpdateShape() {
    // no need to explicitly test if empty, for_each won't do anything if the vector
    // has no elements
    std::for_each(Contour.begin(), Contour.end(), std::bind1st(std::mem_fun(real_update_shape), this));

Или, по крайней мере, используйте некоторые ссылки, чтобы помочь компилятору. Например, преобразовать это:

 //Remove Duplicates
 for(int j = 0; j < 2; ++j)
     if(Contour[i].DrawingPoints.size() > 2)
         for(unsigned int x = 0; x < Contour[i].DrawingPoints.size() - 1; ++x)
             if(Contour[i].DrawingPoints[x].point[0] ==
                 Contour[i].DrawingPoints[x + 1].point[0] &&
                 Contour[i].DrawingPoints[x].point[1] ==
                 Contour[i].DrawingPoints[x + 1].point[1] 

                 Contour[i].DrawingPoints.erase(Contour[i].DrawingPoints.begin() + x);

Примерно так:

 //Remove Duplicates
 for(int j = 0; j < 2; ++j)
     // reference to the one we care about, this may be allowed to be const
     // but I am not sure since it depends on your specific use cases, if it can be
     // it is better to shoot for const correctness as much as possible.
     // PS: types in all caps is very ugly, people will think it's a macro!
     SHAPECONTOUR &current_contour = Contour[i];
     if(current_contour.DrawingPoints.size() > 2)
         for(unsigned int x = 0; x < current_contour.DrawingPoints.size() - 1; ++x)
             if( current_contour.DrawingPoints[x    ].point[0] ==
                 current_contour.DrawingPoints[x + 1].point[0] &&
                 current_contour.DrawingPoints[x    ].point[1] ==
                 current_contour.DrawingPoints[x + 1].point[1])

             current_contour.DrawingPoints.erase(current_contour.DrawingPoints.begin() + x);

Это одна из тех вещей, которые могут помочь, и определенно не причиняют вреда Так что стоит попробовать.

/ 12 июля 2010

Я ничего не знаю о кешировании, но это может помочь расширить ваш вектор вручную, вместо того, чтобы позволить ему расширяться по одному значению за раз по мере их добавления.

Согласно этоссылка , вы можете позвонить reserve, чтобы увеличить максимальный размер вашего вектора.Я бы предложил начать вектор с длиной, скажем, 100, и после заполнения 100-го слота запросить еще 100 слотов.

Этот ответ может не отвечать на вопрос, поскольку я не знаю, как кеширование связаноstd::vector s, но возможно вы столкнулись с проблемой, которую я описал.

