Не могу понять символ **, объясненный в функции csvgetline.c из книги K & P Практика программирования - PullRequest
1 голос
/ 17 июня 2011

Я пытался понять пересмотренную функцию csvgetline в C из главы Интерфейсы книги "Практика программирования" .Я выделил код, который не имеет смысла для меня.

#include "csv.h"

enum { NOMEM = -2 };          /* out of memory signal */
static char* line    = NULL;  /* input chars */
static char* sline   = NULL;  /* line copy used by split */
static int  maxline  = 0;     /* size of line[] and sline[] */
static char** field  = NULL;  /* field pointers */          // This is the problem!
static int  maxfield = 0;     /* size of field[] */
static int  nfield   = 0;     /* number of fields in field[] */

static char fieldsep[] = ","; /* field separator chars */
static char* advquoted(char *);
static int split(void);

/* endofline: check for and consume \r, \n, \r\n, or EOF */
static int endofline(FILE *fin, int c)
{ … }

/* reset: set variables back to starting values */
static void reset(void)
{ … }

/* csvgetline:  get one line, grow as needed */
/* sample input: "LU",86.25,"11/4/1998","2:19PM",+4.0625 */
char* csvgetline( FILE *fin )
{
   int i, c; 
   char *newl, *news;

   if (line == NULL) {     /* allocate on first call */
     maxline = maxfield = 1;
     line = (char *) malloc(maxline);
     sline = (char *) malloc(maxline);
     field = (char **) malloc(maxfield*sizeof(field));   // This is the problem!

     if (line == NULL || sline == NULL || field == NULL) {
       reset();

      return NULL;    /* out of memory */
    }
  }

  for (i=0; (c=getc(fin))!=EOF && !endofline(fin,c); i++) {
    if (i >= maxline-1) { /* grow line */
      maxline *= 2;   /* double current size */
      newl = (char *) realloc(line, maxline);
      if (newl == NULL) {
        reset();
        return NULL;
      }

      line = newl;
      news = (char *) realloc(sline, maxline);
      if (news == NULL) {
        reset();
        return NULL;
      }

      sline = news;
    }

    line[i] = c;
  }

  line[i] = '\0';

  if (split() == NOMEM) {
    reset();
    return NULL;      /* out of memory */
  }

  return (c == EOF && i == 0) ? NULL : line;
}


/* split: split line into fields */
static int split(void)
{
  char *p, **newf;
  char *sepp; /* pointer to temporary separator character */
  int sepc;   /* temporary separator character */
  nfield = 0;
  if (line[0] == '\0')
    return 0;

  strcpy(sline, line);
  p = sline;

  do {
    if (nfield >= maxfield) {
      maxfield *= 2;      /* double current size */
      newf = (char **) realloc(field,  maxfield * sizeof(field[0]));
      if (newf == NULL)
        return NOMEM;
      field = newf;
    }

    if (*p == '"')
      sepp = advquoted(++p);  /* skip initial quote */
    else
      sepp = p + strcspn(p, fieldsep);

    sepc = sepp[0];

    printf("%d", sepp[0]);   // Debug

    sepp[0] = '\0';       /* terminate field */
    field[nfield++] = p;
    p = sepp + 1;
  } while (sepc == ',');

  return nfield;
}

/* advquoted: quoted field; return pointer to next separator */
static char *advquoted(char *p)
{ … }

/* csvfield:  return pointer to n-th field */
char* csvfield(int n)
{
  if (n < 0 || n >= nfield)
    return NULL;
  return field[n];    // This is the problem!
}

/* csvnfield:  return number of fields */
int csvnfield(void)
{
  return nfield;
}

/* csvtest main: test CSV library */
int main(void)
{
  int i;
  char *line;

  while ((line = csvgetline(stdin)) != NULL) {
    printf("line = `%s'\n", line);
    for (i = 0; i < csvnfield(); i++)
      printf("field[%d] = `%s'\n", i, csvfield(i));  // This line is a problem
  }
  return 0;
}

Что я не могу понять, так это поле char**, которое, я считаю, является указателем на массив указателей на строки /массив символов / полей.Поэтому field[n] должен содержать указатель на строку, т.е. адрес строки, а не саму строку.Но, похоже, это не тот случай, поскольку при обращении к нему в операторе printf() функция csvfield(i) возвращает значение, а не указатель на n-е поле.

Я просмотрел много веб-сайтовпытаюсь понять char ** но информация очень и очень ограничена.Один сайт сказал, что char * - это указатель на массив символов, а char** - это указатель на символ.Другой сайт говорит о том, что тип char ** является скалярным типом.Но я все еще неясен относительно этого char **.

Не могли бы вы объяснить это мне?

Ответы [ 2 ]

1 голос
/ 22 сентября 2014

В вашей транскрипции кода из книги есть небольшая проблема, а затем есть понимание, необходимое для char **field;, чтобы иметь смысл.

В моем экземпляре книги первая строка, которую вам трудно понять, написана не так, как вы цитируете. Ваша цитата первая; то, что говорится в книге, занимает второе место:

 field = (char **) malloc(maxfield*sizeof(field));
 field = (char **) malloc(maxfield*sizeof(field[0]));

Я с облегчением, потому что официальная версия верна, хотя первая будет работать несколько случайно. Разница заключается в том, что пространство выделяется для maxfield копий char **, в то время как для этого большого количества char * требуется пространство. Теперь, как это происходит, sizeof(char **) == sizeof(char *), но лучше всего уяснить, о чем просят. Для указателя ptr типа Xyz * идиома для выделения массива значений N:

Xyz *ptr = (Xyz *)malloc(N * sizeof(*ptr));

где *ptr, конечно, относится к типу Xyz и также эквивалентно ptr[0], обозначению, используемому в книге.

Теперь о char **field… то, что выделено, можно понять с помощью диаграммы, подобной этой:

+-------+     +----------+
| field |---->| field[0] |
+-------+     +----------+
              | field[1] |
              +----------+
              | field[2] |
              +----------+
              | field[3] |
              +----------+
                  ...

При первоначальном выделении каждый из field[0], field[1],… не имеет инициализированного значения и нигде не указывает. В коде при разборе полей пространство выделяется для каждого поля следующим образом:

 char **         char *          char
+-------+     +----------+     +----------------+
| field |---->| field[0] |---->| String value 1 |
+-------+     +----------+     +----------------+    +----------+
              | field[1] |-------------------------->| String 2 |
              +----------+     +--------------+      +----------+
              | field[2] |---->| Third String |
              +----------+     +--------------+
              | field[3] |
              +----------+
                  ...

Элементы массива являются смежными; строки не являются смежными. Каждый элемент массива - это, конечно, char *.

Теперь внутри csvfield(int n) функция возвращает NULL или field[n]. Как видно из диаграммы, значения field[n] равны char *. Таким образом, код верен, и он возвращает char *, как указано в сигнатуре функции. (Код тоже компилируется, даже при строгих уровнях предупреждения.)

0 голосов
/ 17 июня 2011

Вы правы, char** можно рассматривать как массив указателей на строки / символьный массив / поля.Как ты printf csvfield(i)?Если вы сделали это с форматом "...%s...", убедитесь, что он выведет строковое значение;если вы хотите указатель адреса, используйте формат "...%p...".

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...