Как выровнять указатель в C - PullRequest
24 голосов
/ 30 января 2011

Есть ли способ выровнять указатель в C? Предположим, я записываю данные в стек массива (поэтому указатель идет вниз) и хочу, чтобы следующие записываемые данные были выровнены по 4, чтобы данные записывались в ячейку памяти, кратную 4, как бы я это сделал что?

У меня есть

 uint8_t ary[1024];
 ary = ary+1024;
 ary -= /* ... */

Теперь предположим, что ary указывает на местоположение 0x05. Я хочу, чтобы это указывало на 0x04. Теперь я могу просто сделать

ary -= (ary % 4);

но C не позволяет по модулю указатели. Есть ли какое-либо решение, которое не зависит от архитектуры?

Ответы [ 4 ]

42 голосов
/ 30 января 2011

Массивы являются НЕ указателями, несмотря на все, что вы, возможно, читали в неправильных ответах здесь (имеется в виду этот вопрос в частности или переполнение стека в целом - или где-либо еще).

Вы не можете изменить значение, представленное именем массива, как показано.

Возможно, сбивает с толку то, что если ary является параметром функции, то появится возможность настроить массив:

void function(uint8_t ary[1024])
{
    ary += 213; // No problem because ary is a uint8_t pointer, not an array
    ...
}

Массивы в качестве параметров для функций отличаются от массивов, определенных либо вне функции, либо внутри функции.

Вы можете сделать:

uint8_t    ary[1024];
uint8_t   *stack = ary + 510;
uintptr_t  addr  = (uintptr_t)stack;

if (addr % 8 != 0)
    addr += 8 - addr % 8;
stack = (uint8_t *)addr;

Это гарантирует, что значение в stack выровнено по 8-байтовой границе, округлено в большую сторону. Ваш вопрос требует округления до 4-байтовой границы, поэтому код изменяется на:

if (addr % 4 != 0)
    addr -= addr % 4;
stack = (uint8_t *)addr;

Да, вы можете сделать это и с помощью битовых масок. Или:

addr = (addr + (8 - 1)) & -8;  // Round up to 8-byte boundary

или

addr &= -4;                    // Round down to a 4-byte boundary

Это работает правильно, только если LHS является степенью двойки, а не для произвольных значений. Код с операциями модуля будет работать правильно для любого (положительного) модуля.

См. Также: Как выделить выровненную память, используя только стандартную библиотеку .


Демонстрационный код

Gnzlbg прокомментировал :

Код для степени двух разрывов, если я пытаюсь выровнять, например. uintptr_t (2) с точностью до 1 байта (обе являются степенями 2: 2 ^ 1 и 2 ^ 0). Результат равен 1, но должен быть равен 2, поскольку 2 уже выровнено по границе в 1 байт.

Этот код демонстрирует, что код выравнивания в порядке - до тех пор, пока вы правильно интерпретируете комментарии выше (теперь разъясняемые словами «либо», либо «», разделяющими операции маскирования битов; меня поймали при первой проверке кода).

Функции выравнивания могут быть написаны более компактно, особенно без утверждений, но компилятор оптимизирует для получения того же кода из того, что написано и что можно написать. Некоторые из утверждений также могут быть более строгими. И, возможно, тестовая функция должна распечатать базовый адрес стека, прежде чем делать что-либо еще.

Код может и, возможно, должен проверять, не будет ли числового переполнения или переполнения арифметикой. Это будет более вероятной проблемой, если вы выровняете адреса по границе в несколько мегабайт; в то время как вы сохраняете выравнивание менее 1 КиБ, вы вряд ли найдете проблему, если не пытаетесь выйти за пределы массивов, к которым у вас есть доступ. (Строго говоря, даже если вы выполняете выравнивание в несколько мегабайт, вы не столкнетесь с проблемами, если результат будет в пределах диапазона памяти, выделенного для массива, которым вы манипулируете.)

#include <assert.h>
#include <stdint.h>
#include <stdio.h>

/*
** Because the test code works with pointers to functions, the inline
** function qualifier is moot.  In 'real' code using the functions, the
** inline might be useful.
*/

/* Align upwards - arithmetic mode (hence _a) */
static inline uint8_t *align_upwards_a(uint8_t *stack, uintptr_t align)
{
    assert(align > 0 && (align & (align - 1)) == 0); /* Power of 2 */
    assert(stack != 0);

    uintptr_t addr  = (uintptr_t)stack;
    if (addr % align != 0)
        addr += align - addr % align;
    assert(addr >= (uintptr_t)stack);
    return (uint8_t *)addr;
}

/* Align upwards - bit mask mode (hence _b) */
static inline uint8_t *align_upwards_b(uint8_t *stack, uintptr_t align)
{
    assert(align > 0 && (align & (align - 1)) == 0); /* Power of 2 */
    assert(stack != 0);

    uintptr_t addr  = (uintptr_t)stack;
    addr = (addr + (align - 1)) & -align;   // Round up to align-byte boundary
    assert(addr >= (uintptr_t)stack);
    return (uint8_t *)addr;
}

/* Align downwards - arithmetic mode (hence _a) */
static inline uint8_t *align_downwards_a(uint8_t *stack, uintptr_t align)
{
    assert(align > 0 && (align & (align - 1)) == 0); /* Power of 2 */
    assert(stack != 0);

    uintptr_t addr  = (uintptr_t)stack;
    addr -= addr % align;
    assert(addr <= (uintptr_t)stack);
    return (uint8_t *)addr;
}

/* Align downwards - bit mask mode (hence _b) */
static inline uint8_t *align_downwards_b(uint8_t *stack, uintptr_t align)
{
    assert(align > 0 && (align & (align - 1)) == 0); /* Power of 2 */
    assert(stack != 0);

    uintptr_t addr  = (uintptr_t)stack;
    addr &= -align;                         // Round down to align-byte boundary
    assert(addr <= (uintptr_t)stack);
    return (uint8_t *)addr;
}

static inline int inc_mod(int x, int n)
{
    assert(x >= 0 && x < n);
    if (++x >= n)
        x = 0;
    return x;
}

typedef uint8_t *(*Aligner)(uint8_t *addr, uintptr_t align);

static void test_aligners(const char *tag, Aligner align_a, Aligner align_b)
{
    const int align[] = { 64, 32, 16, 8, 4, 2, 1 };
    enum { NUM_ALIGN = sizeof(align) / sizeof(align[0]) };
    uint8_t stack[1024];
    uint8_t *sp = stack + sizeof(stack);
    int dec = 1;
    int a_idx = 0;

    printf("%s\n", tag);
    while (sp > stack)
    {
        sp -= dec++;
        uint8_t *sp_a = (*align_a)(sp, align[a_idx]);
        uint8_t *sp_b = (*align_b)(sp, align[a_idx]);
        printf("old %p, adj %.2d, A %p, B %p\n",
               (void *)sp, align[a_idx], (void *)sp_a, (void *)sp_b);
        assert(sp_a == sp_b);
        sp = sp_a;
        a_idx = inc_mod(a_idx, NUM_ALIGN);
    }
    putchar('\n');
}

int main(void)
{
    test_aligners("Align upwards", align_upwards_a, align_upwards_b);
    test_aligners("Align downwards", align_downwards_a, align_downwards_b);
    return 0;
}

Пример вывода (частично усеченный):

Align upwards
old 0x7fff5ebcf4af, adj 64, A 0x7fff5ebcf4c0, B 0x7fff5ebcf4c0
old 0x7fff5ebcf4be, adj 32, A 0x7fff5ebcf4c0, B 0x7fff5ebcf4c0
old 0x7fff5ebcf4bd, adj 16, A 0x7fff5ebcf4c0, B 0x7fff5ebcf4c0
old 0x7fff5ebcf4bc, adj 08, A 0x7fff5ebcf4c0, B 0x7fff5ebcf4c0
old 0x7fff5ebcf4bb, adj 04, A 0x7fff5ebcf4bc, B 0x7fff5ebcf4bc
old 0x7fff5ebcf4b6, adj 02, A 0x7fff5ebcf4b6, B 0x7fff5ebcf4b6
old 0x7fff5ebcf4af, adj 01, A 0x7fff5ebcf4af, B 0x7fff5ebcf4af
old 0x7fff5ebcf4a7, adj 64, A 0x7fff5ebcf4c0, B 0x7fff5ebcf4c0
old 0x7fff5ebcf4b7, adj 32, A 0x7fff5ebcf4c0, B 0x7fff5ebcf4c0
old 0x7fff5ebcf4b6, adj 16, A 0x7fff5ebcf4c0, B 0x7fff5ebcf4c0
old 0x7fff5ebcf4b5, adj 08, A 0x7fff5ebcf4b8, B 0x7fff5ebcf4b8
old 0x7fff5ebcf4ac, adj 04, A 0x7fff5ebcf4ac, B 0x7fff5ebcf4ac
old 0x7fff5ebcf49f, adj 02, A 0x7fff5ebcf4a0, B 0x7fff5ebcf4a0
old 0x7fff5ebcf492, adj 01, A 0x7fff5ebcf492, B 0x7fff5ebcf492
…
old 0x7fff5ebcf0fb, adj 08, A 0x7fff5ebcf100, B 0x7fff5ebcf100
old 0x7fff5ebcf0ca, adj 04, A 0x7fff5ebcf0cc, B 0x7fff5ebcf0cc
old 0x7fff5ebcf095, adj 02, A 0x7fff5ebcf096, B 0x7fff5ebcf096

Align downwards
old 0x7fff5ebcf4af, adj 64, A 0x7fff5ebcf480, B 0x7fff5ebcf480
old 0x7fff5ebcf47e, adj 32, A 0x7fff5ebcf460, B 0x7fff5ebcf460
old 0x7fff5ebcf45d, adj 16, A 0x7fff5ebcf450, B 0x7fff5ebcf450
old 0x7fff5ebcf44c, adj 08, A 0x7fff5ebcf448, B 0x7fff5ebcf448
old 0x7fff5ebcf443, adj 04, A 0x7fff5ebcf440, B 0x7fff5ebcf440
old 0x7fff5ebcf43a, adj 02, A 0x7fff5ebcf43a, B 0x7fff5ebcf43a
old 0x7fff5ebcf433, adj 01, A 0x7fff5ebcf433, B 0x7fff5ebcf433
old 0x7fff5ebcf42b, adj 64, A 0x7fff5ebcf400, B 0x7fff5ebcf400
old 0x7fff5ebcf3f7, adj 32, A 0x7fff5ebcf3e0, B 0x7fff5ebcf3e0
old 0x7fff5ebcf3d6, adj 16, A 0x7fff5ebcf3d0, B 0x7fff5ebcf3d0
old 0x7fff5ebcf3c5, adj 08, A 0x7fff5ebcf3c0, B 0x7fff5ebcf3c0
old 0x7fff5ebcf3b4, adj 04, A 0x7fff5ebcf3b4, B 0x7fff5ebcf3b4
old 0x7fff5ebcf3a7, adj 02, A 0x7fff5ebcf3a6, B 0x7fff5ebcf3a6
old 0x7fff5ebcf398, adj 01, A 0x7fff5ebcf398, B 0x7fff5ebcf398
…
old 0x7fff5ebcf0f7, adj 01, A 0x7fff5ebcf0f7, B 0x7fff5ebcf0f7
old 0x7fff5ebcf0d3, adj 64, A 0x7fff5ebcf0c0, B 0x7fff5ebcf0c0
old 0x7fff5ebcf09b, adj 32, A 0x7fff5ebcf080, B 0x7fff5ebcf080
2 голосов
/ 14 февраля 2018

НЕ ИСПОЛЬЗУЙТЕ МОДУЛЬ !!!ЭТО ДЕЙСТВИТЕЛЬНО МЕДЛЕННО !!!Руки вниз, самый быстрый способ выровнять указатель - использовать математические дополнения 2.Вам необходимо инвертировать биты, добавить один и замаскировать 2 (для 32-разрядных) или 3 (для 64-разрядных) младших значащих битов.Результатом является смещение, которое вы затем добавляете к значению указателя, чтобы выровнять его.Отлично работает для 32 и 64-битных чисел.Для 16-битного выравнивания просто замаскируйте указатель с 0x1 и добавьте это значение.Алгоритм работает одинаково на любом языке, но, как вы можете видеть, Embedded C ++ значительно превосходит C по всем формам и формам.

#include <cstdint>
/** Returns the number to add to align the given pointer to a 8, 16, 32, or 64-bit 
    boundary.
    @author Cale McCollough.
    @param  ptr The address to align.
    @return The offset to add to the ptr to align it. */
template<typename T>
inline uintptr_t MemoryAlignOffset (const void* ptr) {
    return ((~reinterpret_cast<uintptr_t> (ptr)) + 1) & (sizeof (T) - 1);
}

/** Word aligns the given byte pointer up in addresses.
    @author Cale McCollough.
    @param ptr Pointer to align.
    @return Next word aligned up pointer. */
template<typename T>
inline T* MemoryAlign (T* ptr) {
    uintptr_t offset = MemoryAlignOffset<uintptr_t> (ptr);
    char* aligned_ptr = reinterpret_cast<char*> (ptr) + offset;
    return reinterpret_cast<T*> (aligned_ptr);
}

Для подробного описания и доказательств, пожалуйста, @see https://github.com/kabuki-starship/kabuki-toolkit/wiki/Fastest-Method-to-Align-Pointers.Если вы хотите увидеть доказательство того, почему вы никогда не должны использовать модуль по модулю, я изобрел самый быстрый в мире алгоритм целочисленных значений в строку.Тест на бумаге показывает эффект оптимизации только одной инструкции по модулю.Пожалуйста, @see https://github.com/kabuki-starship/kabuki-toolkit/wiki/Engineering-a-Faster-Integer-to-String-Algorithm.

Graph of why you shouldn't use modulo

1 голос
/ 30 января 2011

Я редактирую этот ответ, потому что:

  1. У меня была ошибка в исходном коде (я забыл типотип intptr_t) и
  2. Я отвечаю на критику Джонатана Леффлера, чтобы прояснить свои намерения.

Приведенный ниже код не означает, что вы можете изменить значение массива (foo). Но вы можете получить выровненный указатель на этот массив, и этот пример иллюстрирует один из способов сделать это.

#define         alignmentBytes              ( 1 << 2 )   // == 4, but enforces the idea that that alignmentBytes should be a power of two
#define         alignmentBytesMinusOne      ( alignmentBytes - 1 )

uint8_t         foo[ 1024 + alignmentBytesMinusOne ];
uint8_t         *fooAligned;

fooAligned = (uint8_t *)((intptr_t)( foo + alignmentBytesMinusOne ) & ~alignmentBytesMinusOne);
0 голосов
/ 12 июля 2019

Основываясь на уловках, изученных в другом месте, и на одном из чтения @par ответа, по-видимому, все, что мне нужно для моего особого случая, который относится к 32-битной машине, - это ((size - 1) | 3) + 1, который действует так и может быть полезным для других,

for (size_t size = 0; size < 20; ++size) printf("%d\n", ((size - 1) | 3) + 1);

0
4
4
4
4
8
8
8
8
12
12
12
12
16
16
16
16
20
20
20
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...