почему компилятор vs c ++ 2010 создает другой код сборки для аналогичной функции - PullRequest
7 голосов
/ 23 марта 2012

Так недавно я думал о strcpy и вернулся к K & R, где они показывают реализацию как

while (*dst++ = *src++) ;

Однако я ошибочно расшифровал это как:

while (*dst = *src)
{
    src++; //technically could be ++src on these lines
    dst++; 
}

В любом случае, это заставило меня задуматься о том, будет ли компилятор на самом деле создавать разные коды для этих двух. Первоначально я думал, что они должны быть почти идентичны, поскольку src и dst увеличиваются, но никогда не используются. Я подумал, что компилятор будет знать, не пытаться фактически сохранить их как «переменные» в произведенном машинном коде.

Используя windows7 со сборкой VS 2010 C ++ SP1 в 32-битном режиме выпуска (/ O2), я получил код разборки для обоих приведенных выше воплощений. Чтобы сама функция не ссылалась на вход и не была встроена, я сделал dll с каждой из функций. Я опустил пролог и эпилог выпущенного АСМ.

    while (*dst++ = *src++)
6EBB1003 8B 55 08             mov         edx,dword ptr [src]     
6EBB1006 8B 45 0C             mov         eax,dword ptr [dst]     
6EBB1009 2B D0                sub         edx,eax                //prepare edx so that edx + eax always points to src     
6EBB100B EB 03                jmp         docopy+10h (6EBB1010h)  
6EBB100D 8D 49 00             lea         ecx,[ecx]              //looks like align padding, never hit this line
6EBB1010 8A 0C 02             mov         cl,byte ptr [edx+eax]  //ptr [edx+ eax] points to char in src  :loop begin
6EBB1013 88 08                mov         byte ptr [eax],cl      //copy char to dst
6EBB1015 40                   inc         eax                    //inc src ptr
6EBB1016 84 C9                test        cl,cl                  // check for 0 (null terminator)
6EBB1018 75 F6                jne         docopy+10h (6EBB1010h)  //if not goto :loop begin
        ;

Выше я аннотировал код, по сути один цикл, только 1 проверка на ноль и 1 копия памяти.

Теперь давайте посмотрим на мою версию ошибки:

    while (*dst = *src)
6EBB1003 8B 55 08             mov         edx,dword ptr [src]  
6EBB1006 8A 0A                mov         cl,byte ptr [edx]  
6EBB1008 8B 45 0C             mov         eax,dword ptr [dst]  
6EBB100B 88 08                mov         byte ptr [eax],cl       //copy 0th char to dst
6EBB100D 84 C9                test        cl,cl                   //check for 0
6EBB100F 74 0D                je          docopy+1Eh (6EBB101Eh)  // return if we encounter null terminator
6EBB1011 2B D0                sub         edx,eax  
6EBB1013 8A 4C 02 01          mov         cl,byte ptr [edx+eax+1]  //get +1th char  :loop begin
    {
        src++;
        dst++;
6EBB1017 40                   inc         eax                   
6EBB1018 88 08                mov         byte ptr [eax],cl        //copy above char to dst
6EBB101A 84 C9                test        cl,cl                    //check for 0
6EBB101C 75 F5                jne         docopy+13h (6EBB1013h)   // if not goto :loop begin
    }

В моей версии я вижу, что сначала копируется 0-й символ в место назначения, затем проверяется на нулевое значение, а затем, наконец, входит в цикл, где снова проверяется на нулевое значение. Таким образом, цикл остается в основном таким же, но теперь он обрабатывает 0-й символ перед циклом. Это, конечно, будет неоптимальным по сравнению с первым случаем.

Мне интересно, знает ли кто-нибудь, почему компилятору мешают создавать такой же (или почти такой же) код, как в первом примере. Это специфическая проблема компилятора ms или, возможно, с моими настройками компилятора / компоновщика?


вот полный код, 2 файла (одна функция заменяет другую).

// in first dll project
__declspec(dllexport) void docopy(const char* src, char* dst)
{
    while (*dst++ = *src++);
}

__declspec(dllexport) void docopy(const char* src, char* dst)
{
    while (*dst = *src)
    {
        ++src;
        ++dst;
    }
}


//seprate main.cpp file calls docopy
void docopy(const char* src, char* dst);
char* source ="source";
char destination[100];
int main()
{

    docopy(source, destination);
}

Ответы [ 3 ]

10 голосов
/ 23 марта 2012

Поскольку в первом примере постинкремент происходит всегда, даже если src начинает указывать на нулевой символ.В той же стартовой ситуации второй пример не будет увеличивать указатели.

2 голосов
/ 23 марта 2012

Конечно, у компилятора есть другие опции. «Сначала скопируйте байт, затем войдите в цикл, если не 0» - это то, что gcc-4.5.1 производит с -O1. С -O2 и -O3 он производит

.LFB0:
    .cfi_startproc
    jmp     .L6             // jump to copy
    .p2align 4,,10
    .p2align 3
.L4:
    addq    $1, %rdi        // increment pointers
    addq    $1, %rsi
.L6:                        // copy
    movzbl  (%rdi), %eax    // get source byte
    testb   %al, %al        // check for 0
    movb    %al, (%rsi)     // move to dest
    jne     .L4             // loop if nonzero
    rep
    ret
    .cfi_endproc

, что очень похоже на то, что он производит для цикла K & R. Я не могу сказать, действительно ли это лучше, но выглядит лучше.

Кроме перехода в цикл, инструкции для цикла K & R точно такие же, просто упорядочены по-разному:

.LFB0:
    .cfi_startproc
    .p2align 4,,10
    .p2align 3
.L2:
    movzbl  (%rdi), %eax    // get source byte
    addq    $1, %rdi        // increment source pointer
    movb    %al, (%rsi)     // move byte to dest
    addq    $1, %rsi        // increment dest pointer
    testb   %al, %al        // check for 0
    jne     .L2             // loop if nonzero
    rep
    ret
    .cfi_endproc
0 голосов
/ 23 марта 2012

Ваш второй код не "снова проверяется на нулевое значение". Во второй версии тело цикла работает с символами по адресу edx+eax+1 (обратите внимание на часть +1), которые будут символами номер 1, 2, 3 и так далее. Код пролога работает с символом номер 0. Это означает, что код никогда не проверяет один и тот же символ дважды, как вы, кажется, верите. Там нет "снова" там.

Второй код - это бот более замысловатый (первая итерация цикла фактически извлечена из него), поскольку, как уже было объяснено, его функциональность отличается. Окончательные значения указателей отличаются между вашим кулаком и вашей второй версией.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...