ANSI C getc вызывает segfault в Linux, но не в OS X - PullRequest
1 голос
/ 28 октября 2009

У меня есть некоторый код ANSI C, который я разработал на своем Mac, но когда я попытался запустить его на серверах Linux нашей школы, у меня возникает ошибка.

Конкретная строка, которая вызывает у меня проблемы - это getc из указателя файла.

Файл существует.

Вот метод, о котором идет речь:

// inits lists with all data in fp file pointer
// returns # of lines read
int init_intlists(FILE *fp, INTLIST *lists[]) {
    int c, ctr;

    ctr = 0;

    // need to use a linked list to store current number
    // for non 1-digit numbers...
    INTLIST *cur_num = NULL;
    int cur_num_len = 0;
    while ((c = getc(fp)) != EOF){
        if(c != '\n' && c != ' '){
            c = c - 48;
            if(cur_num == NULL){
                cur_num = init_intlist(c);
            } else {
                list_append(cur_num, &c);
            }
            cur_num_len++;
        } else if(c == ' ' || c == '\n'){
            // we reached a space, meaning we finished
            // reading a contiguous block of digits
            // now we need to figure out what we actually read...
            int num = 0;
            INTLIST *ptr;
            ptr = cur_num;
            while(cur_num_len != 0){
                cur_num_len--;
                num += pow(10, cur_num_len) * ptr->datum;
                ptr = ptr->next;
            }    

            if(lists[ctr] == NULL){
                // init new list
                lists[ctr] = init_intlist(num);
            } else {
                // append to existing
                list_append(lists[ctr], &num);
            }

            // clear cur_num to read the next one
            cur_num_len = 0;
            list_delete(cur_num);
            cur_num = NULL;
        }

        if(c == '\n') {
            // newline reached - increment to fill in next list
            ctr++;
        }
    }    

    return ctr;
}

Вызов init_intlists, который вызывает segfault, начинается следующим образом:

    FILE *fp = (FILE *)malloc(sizeof(FILE));
    FILE *base_vector_fp = (FILE *)malloc(sizeof(FILE));

    parse_args(argc, argv, fp, base_vector_fp);

    if(fp == NULL || base_vector_fp == NULL){
        fprintf(stderr, "Critical error, could not load input files\n");
        return 1;
    }

    INTLIST *lines[MAX_LINES] = {};
    INTLIST *base_vectors[MAX_LINES] = {};

    int lines_read = init_intlists(fp, lines);

и parse_args выглядит так:

FILE *load_file(char *filename) {
    FILE *fp;

    fp = fopen(filename, "r");

    if(fp == NULL){
        fprintf(stderr, "File %s does not seem to exist.\n", filename);
        return NULL;
    }

    // XXX Does this memory leak?
    // fp is never fclose()'d
    return fp;
}

void parse_args(int argc, char *argv[], FILE *fp, FILE *base_vector_fp) {
    char *prog = argv[0];
    if (argc != 3){
        fprintf(stderr, "Wrong number of arguments supplied.\nUse: %s <data_filename>     <base_vector_filename>\n", prog);
        free(fp);
        free(base_vector_fp);
        fp = NULL;
        base_vector_fp = NULL;
        exit(1);
    }

    char *filename = argv[1];
    *fp = *load_file(filename);

    char *base_vector_filename = argv[2];
    *base_vector_fp = *load_file(base_vector_filename);
}

Поэтому, когда я пытаюсь вызвать это на моем Mac, он работает отлично и читает файл так, как должен, и я могу работать с ним и получить правильные ответы для моего задания.

Однако, когда я пытаюсь запустить его в Linux, я получаю segfault, когда он пытается getc в подпрограмме init_intlists.

Я проверил, что файлы, которые я предоставляю для ввода, существуют и доступны для чтения во всем мире (umask 755). Я пробовал как с абсолютными, так и с относительными путями. Я также пробовал несколько разных входных файлов.

Я попытался использовать gcc 4.2 и gcc 3.4 на сервере Linux, и оба создали двоичный исполняемый файл, который вызовет ошибку segf с любыми заданными входными файлами.

Вот информация о версии между двумя разными версиями gcc:

Mac OS X:

me@dinosaurhunter ~> gcc -v
Using built-in specs.
Target: i686-apple-darwin9
Configured with: /var/tmp/gcc/gcc-5465~16/src/configure --disable-checking -enable-werror --prefix=/usr --mandir=/share/man --enable-languages=c,objc,c++,obj-c++ --program-transform-name=/^[cg][^.-]*$/s/$/-4.0/ --with-gxx-include-dir=/include/c++/4.0.0 --with-slibdir=/usr/lib --build=i686-apple-darwin9 --with-arch=apple --with-tune=generic --host=i686-apple-darwin9 --target=i686-apple-darwin9
Thread model: posix
gcc version 4.0.1 (Apple Inc. build 5465)

Linux:

me@janus:~/assignment_1$ gcc -v
Using built-in specs.
Target: x86_64-linux-gnu
Configured with: ../src/configure -v --enable-languages=c,c++,fortran,objc,obj-c++,treelang --prefix=/usr --enable-shared --with-system-zlib --libexecdir=/usr/lib --without-included-gettext --enable-threads=posix --enable-nls --with-gxx-include-dir=/usr/include/c++/4.2 --program-suffix=-4.2 --enable-clocale=gnu --enable-libstdcxx-debug --enable-objc-gc --enable-mpfr --enable-checking=release --build=x86_64-linux-gnu --host=x86_64-linux-gnu --target=x86_64-linux-gnu
Thread model: posix
gcc version 4.2.4 (Ubuntu 4.2.4-1ubuntu4)

Я вызываю компилятор, используя тот же Makefile как в OS X, так и в Linux. Конечный вызов gcc выглядит следующим образом:

gcc  -Wall -g  -c src/common_file_io.c src/main.c src/intlist.c
gcc  -Wall -g  common_file_io.o main.o intlist.o -lreadline -lm  -o bin/myprogram 

Есть идеи? Я в полной растерянности, как и мой профессор.

Ответы [ 3 ]

10 голосов
/ 28 октября 2009

Вы не должны выделять свои собственные FILE объекты, обычно это непрозрачные объекты, управляемые libc. Не free() их тоже, это сделано fclose(3). Хотя теоретически вы могли бы выделить один и сделать структурное назначение и заставить его работать, было бы лучше не бороться с библиотекой и просто передавать ссылку, как все остальные. Библиотека может сохранять или не сохранять состояние, которое не входит в структуру FILE, а просмотр внутри или разыменование всей структуры - достаточно плохой стиль, и разработчики могут даже предположить, что вы никогда этого не сделаете.

Если вы хотите вернуть FILE *, вы можете либо использовать его в качестве значения указателя возврата, как вы это делали в одном случае, либо использовать двойной косвенный указатель: FILE *fp; f(&fp);.

Хм, я только что заметил, что C99 фактически указывает это в 7.19.13 :

6 Адрес используемого объекта FILE контролировать поток может быть значительное; копия объекта FILE не нужно служить вместо оригинал.

При этом они уведомляют, что FILE * действительно может быть просто волшебным печеньем.

2 голосов
/ 28 октября 2009

Другие ответы верны - трактуйте FILE * как непрозрачный дескриптор, который вы копируете, не пытайтесь копировать его содержимое. В частности, вы можете исправить свой код следующим образом:

Удалить вызов на malloc при инициализации fp и base_vector_fp:

FILE *fp = NULL;
FILE *base_vector_fp = NULL;

Передать указатель на эти указатели в parse_args, чтобы он мог обновить значения указателя:

parse_args(argc, argv, &fp, &base_vector_fp);

И измените parse_args, чтобы обновить FILE * объекты в вызывающей стороне, а не пытаться работать с FILE объектами:

void parse_args(int argc, char *argv[], FILE **fp, FILE **base_vector_fp) {
    char *prog = argv[0];
    if (argc != 3){
        fprintf(stderr, "Wrong number of arguments supplied.\nUse: %s <data_filename>     <base_vector_filename>\n", prog);
        exit(1);
    }

    char *filename = argv[1];
    *fp = load_file(filename);

    char *base_vector_filename = argv[2];
    *base_vector_fp = load_file(base_vector_filename);
}
0 голосов
/ 28 октября 2009

Вы не должны копировать результат fopen() в FILE объект, и на самом деле вы вообще не должны malloc a FILE объект. Вы всегда должны использовать fopen() для выделения объекта управления FILE.

Объект FILE непрозрачен, и, поистине, он содержит многое, что скрыто для простых смертных. Реализация свободна помещать в нее всевозможные вещи, такие как указатели на другие управляющие структуры и т. Д.

...