Как можно скомпилировать код из кода - PullRequest
0 голосов
/ 30 декабря 2018

Я хочу поэкспериментировать с программами, которые пишут программы на C-коде, и я хочу использовать конструкцию, подобную следующей:

int main() {
    char* srcCode="int f(int x) { return x+42; }";
    int (*compiledFun)(int) = compile(srcCode);
    printf("result=%d", (*compiledFun)(123));
    return 0;
}

Нужный вывод должен быть напечатан " result = 165 ".

Мой вопрос касается функции compile().Я могу попытаться поместить srcCode в файл, затем вызвать внешний компилятор, например gcc, затем попытаться прочитать созданный двоичный файл, возможно, исправить некоторые адреса и, таким образом, заполнить память compiledFun.Но я чувствую, что это было бы очень неэффективно заглушка .Есть ли способ компилировать программу изнутри, прямо из памяти в память?Может быть, какая-то библиотека или подмножество, которые могут быть извлечены из исходных текстов gcc и отвечают за извлечение двоичного кода из исходного текста?


Это может быть важным дополнением, весь исходный код, который должен быть скомпилирован, является функцией, которая принимаетаргументы и возвраты.Он не будет вызывать какие-либо внешние библиотеки и функции, подобные printf, но только сделает некоторые вычисления и вернет.

1 Ответ

0 голосов
/ 01 января 2019

Используйте libtcc компилятор C в памяти от TinyC.

Полный пример здесь https://github.com/TinyCC/tinycc/blob/mob/tests/libtcc_test.c

/*
 * Simple Test program for libtcc
 *
 * libtcc can be useful to use tcc as a "backend" for a code generator.
 */
#include <stdlib.h>
#include <stdio.h>
#include <string.h>

#include "libtcc.h"

/* this function is called by the generated code */
int add(int a, int b)
{
    return a + b;
}

/* this strinc is referenced by the generated code */
const char hello[] = "Hello World!";

char my_program[] =
"#include <tcclib.h>\n" /* include the "Simple libc header for TCC" */
"extern int add(int a, int b);\n"
"#ifdef _WIN32\n" /* dynamically linked data needs 'dllimport' */
" __attribute__((dllimport))\n"
"#endif\n"
"extern const char hello[];\n"
"int fib(int n)\n"
"{\n"
"    if (n <= 2)\n"
"        return 1;\n"
"    else\n"
"        return fib(n-1) + fib(n-2);\n"
"}\n"
"\n"
"int foo(int n)\n"
"{\n"
"    printf(\"%s\\n\", hello);\n"
"    printf(\"fib(%d) = %d\\n\", n, fib(n));\n"
"    printf(\"add(%d, %d) = %d\\n\", n, 2 * n, add(n, 2 * n));\n"
"    return 0;\n"
"}\n";

int main(int argc, char **argv)
{
    TCCState *s;
    int i;
    int (*func)(int);

    s = tcc_new();
    if (!s) {
        fprintf(stderr, "Could not create tcc state\n");
        exit(1);
    }

    /* if tcclib.h and libtcc1.a are not installed, where can we find them */
    for (i = 1; i < argc; ++i) {
        char *a = argv[i];
        if (a[0] == '-') {
            if (a[1] == 'B')
                tcc_set_lib_path(s, a+2);
            else if (a[1] == 'I')
                tcc_add_include_path(s, a+2);
            else if (a[1] == 'L')
                tcc_add_library_path(s, a+2);
        }
    }

    /* MUST BE CALLED before any compilation */
    tcc_set_output_type(s, TCC_OUTPUT_MEMORY);

    if (tcc_compile_string(s, my_program) == -1)
        return 1;

    /* as a test, we add symbols that the compiled program can use.
       You may also open a dll with tcc_add_dll() and use symbols from that */
    tcc_add_symbol(s, "add", add);
    tcc_add_symbol(s, "hello", hello);

    /* relocate the code */
    if (tcc_relocate(s, TCC_RELOCATE_AUTO) < 0)
        return 1;

    /* get entry symbol */
    func = tcc_get_symbol(s, "foo");
    if (!func)
        return 1;

    /* run the code */
    func(32);

    /* delete the state */
    tcc_delete(s);

    return 0;
}
...