Clang: Как выглядит AST (абстрактное синтаксическое дерево)? - PullRequest
10 голосов
/ 29 октября 2011

Привет, я новичок в разработке компиляторов, и мне интересно, как выглядит AST.У меня есть небольшой фрагмент кода, и я использую Clang для генерации AST.Я не получаю много информации из этого.Судя по всему, дерево синтаксиса точно такое же, как и источник, за исключением одной структуры, которая добавляется практически в любой пример, с которым я тестирую.

Источник:

class A {
public:
  int *a, *b, *c;
  int i;
  void sum() {
    a = new int[5];
    b = new int[5];
    c = new int[5];
    for (i = 0; i < 5; i++) {
      a[i] = i;
      b[i] = i;
    }
    for (i = 0; i < 5; i++) {
      c[i] = a[i] + b[i];
    }
    delete[] a;   delete[] b;   delete[] c;
  }
};

class B : public A {
};

int main() {
  B bclass; 
  bclass.sum();
  return 0;
} 

Командадля генерации AST:

clang++ -cc1 -ast-print ~/sum.cpp

Выход AST:

struct __va_list_tag {
    unsigned int gp_offset;
    unsigned int fp_offset;
    void *overflow_arg_area;
    void *reg_save_area;
};
typedef struct __va_list_tag __va_list_tag;
class A {
public:
    int *a;
    int *b;
    int *c;
    int i;
    void sum()     {
        this->a = new int [5];
        this->b = new int [5];
        this->c = new int [5];
        for (this->i = 0; this->i < 5; this->i++) {
            this->a[this->i] = this->i;
            this->b[this->i] = this->i;
        }
        for (this->i = 0; this->i < 5; this->i++) {
            this->c[this->i] = this->a[this->i] + this->b[this->i];
        }
        delete [] this->a;
        delete [] this->b;
        delete [] this->c;
    }


};
class B : public A {
};
int main() {
    B bclass;
    bclass.sum();
    return 0;
}

Спасибо

Ответы [ 3 ]

16 голосов
/ 31 октября 2011

Существует небольшая путаница между различными доступными опциями:

  • -ast-print выполнит симпатичную печать текущего AST, то есть сделает код, который он понимает, настолько близко, насколько это возможно.он проанализировал (но сделал некоторые вещи явными, как появление this)
  • -ast-dump сгенерирует похожее на шутку представление текущего AST

Симпатичный принтерможет быть полезно проверить, что AST без потерь (т. е. сохранил const -ность такого выражения и т. д.), но на самом деле не относится к разработке.

Если вы хотите взломать компиляторвам нужен -ast-dump, который сгенерирует вывод, отображающий непосредственно представление в памяти кода, который был проанализирован.

5 голосов
/ 29 октября 2011

AST - это связанная структура в памяти («дерево» не отражает сложность вещи, но это имя, которое используют люди). -ast-print производит текстовое представление AST. Поскольку человек, который установил этот параметр, уже знаком с C / C ++ -подобным синтаксисом, он печатается в представлении, следующем за этим синтаксисом. Это выбор дизайна, а не счастливое совпадение.

Если вы хотите посмотреть, как выглядит AST, когда он специально не напечатан в привычном синтаксисе, вы можете, например, посмотреть GIMPLE , внутреннее представление GCC.

3 голосов
/ 29 октября 2011

И если вы хотите играть с GIMPLE, вы даже можете использовать GCC MELT для этой цели.MELT - это высокоуровневый предметно-ориентированный язык для работы с GIMPLE!

А внутри компиляторов внутренним представлением часто являются не деревья, а каким-то образом круговые структуры.В GCC базовый блок знает, что это gimple-s, но gimple-s может знать их основные блоки .... (это немного сложнее, но у вас есть идея).

...