C: форматирование строк для hexdump (char * to other char *) - PullRequest
0 голосов
/ 17 января 2019

Я хочу записать шестнадцатеричную одну указатель char* в другую char*.

Для этого я взял этот фрагмент кода :

#include <stdio.h>

void DumpHex(const void* data, size_t size) {
    char ascii[17];
    size_t i, j;
    ascii[16] = '\0';
    for (i = 0; i < size; ++i) {
        printf("%02X ", ((unsigned char*)data)[i]);
        if (((unsigned char*)data)[i] >= ' ' && ((unsigned char*)data)[i] <= '~') {
            ascii[i % 16] = ((unsigned char*)data)[i];
        } else {
            ascii[i % 16] = '.';
        }
        if ((i+1) % 8 == 0 || i+1 == size) {
            printf(" ");
            if ((i+1) % 16 == 0) {
                printf("|  %s \n", ascii);
            } else if (i+1 == size) {
                ascii[(i+1) % 16] = '\0';
                if ((i+1) % 16 <= 8) {
                    printf(" ");
                }
                for (j = (i+1) % 16; j < 16; ++j) {
                    printf("   ");
                }
                printf("|  %s \n", ascii);
            }
        }
    }
}

И изменил это так:

#include <stdio.h>

char* DumpHex2(const void* data, size_t size) {
    const int symbolSize = 100;
    char* buffer = calloc(10*size, sizeof(char));
    char* symbol = calloc(symbolSize, sizeof(char));

    char ascii[17];
    size_t i, j;
    ascii[16] = '\0';
    for (i = 0; i < size; ++i) {
        snprintf(symbol, symbolSize, "%02X ", ((unsigned char*)data)[i]);
        strcat(buffer, symbol);
        memset(symbol,0,strlen(symbol));
        if (((unsigned char*)data)[i] >= ' ' && ((unsigned char*)data)[i] <= '~') {
            ascii[i % 16] = ((unsigned char*)data)[i];
        } else {
            ascii[i % 16] = '.';
        }
        if ((i+1) % 8 == 0 || i+1 == size) {
            strcat(buffer, " ");
            if ((i+1) % 16 == 0) {
                snprintf(symbol, symbolSize, "|  %s \n", ascii);
                strcat(buffer, symbol);
                memset(symbol,0,strlen(symbol));
            } else if (i+1 == size) {
                ascii[(i+1) % 16] = '\0';
                if ((i+1) % 16 <= 8) {
                    strcat(buffer, " ");
                }
                for (j = (i+1) % 16; j < 16; ++j) {
                    strcat(buffer, "   ");
                }
                snprintf(symbol, symbolSize, "|  %s \n", ascii);
                strcat(buffer, symbol);
                memset(symbol,0,strlen(symbol));
            }
        }
    }

    free(symbol);

    return buffer;
}

Работает и возвращает тот же вывод:

int main(int argc, char **argv) {
    char* text = "Hello World! é";

    DumpHex(text, strlen(text));

    char* dump = DumpHex2(text, strlen(text));
    printf("%s", dump);
    free(dump);

    return EXIT_SUCCESS;
}

Выход:

48 65 6C 6C 6F 20 57 6F  72 6C 64 21 20 C3 A9     |  Hello World! .. 
48 65 6C 6C 6F 20 57 6F  72 6C 64 21 20 C3 A9     |  Hello World! .. 

Однако мои модификации, т. Е .:

snprintf(symbol, symbolSize, "|  %s \n", ascii);
strcat(buffer, symbol);
memset(symbol,0,strlen(symbol));

Выглядишь плохо для меня (я новичок в C). Есть ли способ форматировать и добавлять строки проще?

1 Ответ

0 голосов
/ 17 января 2019

Нельзя использовать strlen() для неинициализированных данных:

char* buffer = malloc(1000000);
memset(buffer,0,strlen(buffer));

У strlen() нет способа узнать размер выделенной памяти, поскольку он опирается на завершающий нулевой символ (0, '\0'), который может или не может быть где-то в памяти, на которую указывает по буферу. Либо укажите размер памяти, выделенной в memset():

memset(buffer, 0, 1000000);

или используйте calloc(), который инициализирует выделенную память нулями:

char buffer = calloc(1000000, sizeof(char));  // or calloc(1000000, 1) since sizeof(char) is 1 by definition.

В вашем коде могут быть и другие проблемы. Например, вы вызываете DumpHex2() дважды в main(), но никогда не освобождаете память, которую выделяет функция. Память, выделенная для symbol, также просочилась.

Было бы легче ответить, если бы вы обновили свой вопрос, включив в него точный формат текста, который вы хотите DumpHex2() создать.

Вы должны использовать isprint(), чтобы определить, можно ли печатать символ или нет.

Короче и ИМХО легче читать и понимать:

#include <ctype.h>   // isprint()
#include <stddef.h>  // size_t
#include <stdlib.h>  // malloc(), free()
#include <string.h>  // strcat()
#include <stdio.h>   // sprintf()

enum {
    DUMP_BYTES_PER_LINE = 16,
    DUMP_BYTES_GROUP = 8,
    DUMP_CHARS_PER_LINE = DUMP_BYTES_PER_LINE * 4 + DUMP_BYTES_PER_LINE / DUMP_BYTES_GROUP + 4
};

char* DumpHex(const void* data, size_t size)
{
    size_t const num_lines = size / DUMP_BYTES_PER_LINE + ((size % DUMP_BYTES_PER_LINE) > 0);
    size_t const result_length = num_lines * DUMP_CHARS_PER_LINE;

    char *result = malloc((result_length + 1) * sizeof(*result));
    if (!result)
        return NULL;

    memset(result, ' ', result_length);
    result[result_length] = '\0';

    char *dump_pos = result;
    char *plain_pos = result + DUMP_BYTES_PER_LINE * 3 + DUMP_BYTES_PER_LINE / DUMP_BYTES_GROUP + 3;
    char unsigned const *src = data;

    for (size_t i = 0; i < size; ++i, dump_pos += 3, ++plain_pos) {

        sprintf(dump_pos, "%02x ", (int)src[i]);
        dump_pos[3] = ' ';
        *plain_pos = isprint(src[i]) ? src[i] : '.';

        if ((i + 1) % DUMP_BYTES_PER_LINE == 0 || i + 1 == size) {
            *++plain_pos = '\n';

            size_t const bytes_per_line_left = (i + 1) % DUMP_BYTES_PER_LINE;
            plain_pos[bytes_per_line_left ? -(long long)bytes_per_line_left - 3 : -DUMP_BYTES_PER_LINE - 3] = '|';

            dump_pos = plain_pos + 1 - 3;
            plain_pos = dump_pos + DUMP_BYTES_PER_LINE * 3 + DUMP_BYTES_PER_LINE / DUMP_BYTES_GROUP + 5;
        }
        else if ((i + 1) % DUMP_BYTES_GROUP == 0) {
            ++dump_pos;
        }
    }

    return result;
}
...