Как дать компилятору подсказку о максимальном времени выполнения цикла - PullRequest
5 голосов
/ 03 марта 2012
// if I know that in_x will never be bigger than Max
template <unsigned Max>
void foo(unsigned in_x)
{
    unsigned cap = Max;

    // I can tell the compiler this loop will never run more than log(Max) times
    for (; cap != 0 && in_x != 0; cap >>= 1, in_x >>= 1)
    {
    }
}

Как показано в приведенном выше коде, я думаю, что если я просто напишу

для (; in_x! = 0; in_x >> = 1)

компилятор не развернет цикл, поскольку не может быть уверен в максимально возможном значении in_x.

Я хотел бы знать, прав я или нет, и есть ли лучшие способы справиться с такими вещами.


Или, возможно, проблему можно обобщить так, как если бы можно было написать некоторый код, чтобы сообщить компилятору диапазон некоторого значения времени выполнения, и такой код не обязательно компилируется в двоичный файл времени выполнения.


Истинно, борюсь с компилятором XD

// with MSC
// if no __forceinline here, unrolling is ok, but the function will not be inlined
// if I add __forceinline here, lol, the entire loop is unrolled (or should I say the tree is expanded)...
// compiler freezes when Max is something like 1024
template <int Max>
__forceinline void find(int **in_a, int in_size, int in_key)
{
    if (in_size == 0)
    {
        return;
    }

    if (Max == 0)
    {
        return;
    }

    {
        int m = in_size / 2;

        if ((*in_a)[m] >= in_key)
        {
            find<Max / 2>(in_a, m, in_key);
        }
        else
        {
            *in_a = *in_a + m + 1;

            find<Max - Max / 2 - 1>(in_a, in_size - (m + 1), in_key);
        }
    }
}

1 Ответ

3 голосов
/ 03 марта 2012

Правильный способ добиться такого поведения - это самостоятельно развернуть цикл, используя TMP. Даже с этим, вы будете полагаться на сотрудничество компилятора для массивного встраивания (что не предоставлено). Посмотрите на следующий код, чтобы увидеть, помогает ли он:

template <unsigned char MaxRec>
inline void foo(unsigned in_x)
{
    if (MaxRec == 0) // will be eliminated at compile time
        return; // tells the compiler to stop the pseudo recursion

    if (in_x == 0) {
        // TODO : end recursion;
        return;
    };

    // TODO: Process for iteration rec

    // Note: NOT recursion, the compiler would not be able to inline
    foo<MaxRec-1>(in_x >> 1);
}

// Usage:
foo<5>(in_x); // doubt the compiler will inline 32 times, but you can try.
...