Вдохновленный вопросом Разница в инициализации и обнулении массива в c / c ++? , я решил на самом деле изучить сборку, в моем случае, оптимизированной сборки выпуска для Windows Mobile Professional (процессор ARM от оптимизирующего компилятора Microsoft). То, что я нашел, было несколько удивительным, и мне интересно, сможет ли кто-нибудь пролить свет на мои вопросы по этому поводу.
Эти два примера рассматриваются:
byte a[10] = { 0 };
byte b[10];
memset(b, 0, sizeof(b));
Они используются в одной и той же функции, поэтому стек выглядит так:
[ ] // padding byte to reach DWORD boundary
[ ] // padding byte to reach DWORD boundary
[ ] // b[9] (last element of b)
[ ]
[ ]
[ ]
[ ]
[ ]
[ ]
[ ]
[ ]
[ ] // b[0] = sp + 12 (stack pointer + 12 bytes)
[ ] // padding byte to reach DWORD boundary
[ ] // padding byte to reach DWORD boundary
[ ] // a[9] (last element of a)
[ ]
[ ]
[ ]
[ ]
[ ]
[ ]
[ ]
[ ]
[ ] // a[0] = sp (stack pointer, at bottom)
Сгенерированная сборка с моими комментариями:
; byte a[10] = { 0 };
01: mov r3, #0 // r3 = 0
02: mov r2, #9 // 3rd arg to memset: 9 bytes, note that sizeof(a) = 10
03: mov r1, #0 // 2nd arg to memset: 0-initializer
04: add r0, sp, #1 // 1st arg to memset: &a[1] = a + 1, since only 9 bytes will be set
05: strb r3, [sp] // a[0] = r3 = 0, sets the first element of a
06: bl memset // continue in memset
; byte b[10];
; memset(b, 0, sizeof(b));
07: mov r2, #0xA // 3rd arg to memset: 10 bytes, sizeof(b)
08: mov r1, #0 // 2nd arg to memset: 0-initializer
09: add r0, sp, #0xC // 1st arg to memset: sp + 12 bytes (the 10 elements
// of a + 2 padding bytes for alignment) = &b[0]
10: bl memset // continue in memset
Теперь меня смущают две вещи:
- Какой смысл в строках 02 и 05? Почему бы просто не дать & a [0] и 10 байтов в memset?
- Почему байты заполнения не инициализированы 0? Это только для заполнения в структурах?
Редактировать: мне было слишком любопытно, чтобы не проверять случай структуры:
struct Padded
{
DWORD x;
byte y;
};
Ассемблер для его инициализации 0:
; Padded p1 = { 0 };
01: mov r3, #0
02: str r3, [sp]
03: mov r3, #0
04: str r3, [sp, #4]
; Padded p2;
; memset(&p2, 0, sizeof(p2));
05: mov r3, #0
06: str r3, [sp]
07: andcs r4, r0, #0xFF
08: str r3, [sp, #4]
Здесь мы видим в строке 04, что заполнение действительно происходит, поскольку используется str
(в отличие от strb
). Верно?