Так недавно я думал о strcpy и вернулся к K & R, где они показывают реализацию как
while (*dst++ = *src++) ;
Однако я ошибочно расшифровал это как:
while (*dst = *src)
{
src++; //technically could be ++src on these lines
dst++;
}
В любом случае, это заставило меня задуматься о том, будет ли компилятор на самом деле создавать разные коды для этих двух. Первоначально я думал, что они должны быть почти идентичны, поскольку src и dst увеличиваются, но никогда не используются. Я подумал, что компилятор будет знать, не пытаться фактически сохранить их как «переменные» в произведенном машинном коде.
Используя windows7 со сборкой VS 2010 C ++ SP1 в 32-битном режиме выпуска (/ O2), я получил код разборки для обоих приведенных выше воплощений. Чтобы сама функция не ссылалась на вход и не была встроена, я сделал dll с каждой из функций. Я опустил пролог и эпилог выпущенного АСМ.
while (*dst++ = *src++)
6EBB1003 8B 55 08 mov edx,dword ptr [src]
6EBB1006 8B 45 0C mov eax,dword ptr [dst]
6EBB1009 2B D0 sub edx,eax //prepare edx so that edx + eax always points to src
6EBB100B EB 03 jmp docopy+10h (6EBB1010h)
6EBB100D 8D 49 00 lea ecx,[ecx] //looks like align padding, never hit this line
6EBB1010 8A 0C 02 mov cl,byte ptr [edx+eax] //ptr [edx+ eax] points to char in src :loop begin
6EBB1013 88 08 mov byte ptr [eax],cl //copy char to dst
6EBB1015 40 inc eax //inc src ptr
6EBB1016 84 C9 test cl,cl // check for 0 (null terminator)
6EBB1018 75 F6 jne docopy+10h (6EBB1010h) //if not goto :loop begin
;
Выше я аннотировал код, по сути один цикл, только 1 проверка на ноль и 1 копия памяти.
Теперь давайте посмотрим на мою версию ошибки:
while (*dst = *src)
6EBB1003 8B 55 08 mov edx,dword ptr [src]
6EBB1006 8A 0A mov cl,byte ptr [edx]
6EBB1008 8B 45 0C mov eax,dword ptr [dst]
6EBB100B 88 08 mov byte ptr [eax],cl //copy 0th char to dst
6EBB100D 84 C9 test cl,cl //check for 0
6EBB100F 74 0D je docopy+1Eh (6EBB101Eh) // return if we encounter null terminator
6EBB1011 2B D0 sub edx,eax
6EBB1013 8A 4C 02 01 mov cl,byte ptr [edx+eax+1] //get +1th char :loop begin
{
src++;
dst++;
6EBB1017 40 inc eax
6EBB1018 88 08 mov byte ptr [eax],cl //copy above char to dst
6EBB101A 84 C9 test cl,cl //check for 0
6EBB101C 75 F5 jne docopy+13h (6EBB1013h) // if not goto :loop begin
}
В моей версии я вижу, что сначала копируется 0-й символ в место назначения, затем проверяется на нулевое значение, а затем, наконец, входит в цикл, где снова проверяется на нулевое значение. Таким образом, цикл остается в основном таким же, но теперь он обрабатывает 0-й символ перед циклом. Это, конечно, будет неоптимальным по сравнению с первым случаем.
Мне интересно, знает ли кто-нибудь, почему компилятору мешают создавать такой же (или почти такой же) код, как в первом примере. Это специфическая проблема компилятора ms или, возможно, с моими настройками компилятора / компоновщика?
вот полный код, 2 файла (одна функция заменяет другую).
// in first dll project
__declspec(dllexport) void docopy(const char* src, char* dst)
{
while (*dst++ = *src++);
}
__declspec(dllexport) void docopy(const char* src, char* dst)
{
while (*dst = *src)
{
++src;
++dst;
}
}
//seprate main.cpp file calls docopy
void docopy(const char* src, char* dst);
char* source ="source";
char destination[100];
int main()
{
docopy(source, destination);
}