Как заставить YY_INPUT указывать на строку, а не на stdin в Lex & Yacc (Solaris) - PullRequest
13 голосов
/ 17 декабря 2009

Я хочу, чтобы мой yylex() анализировал строку, а не файл или стандартный ввод. Как я могу сделать это с Lex и Yacc, поставляемыми с Solaris?

Ответы [ 5 ]

14 голосов
/ 19 июля 2011

Переопределить YY_INPUT. Вот рабочий пример, скомпилируйте и запустите с помощью команд

yacc -d parser.y
lex lexer.l
gcc -o myparser *.c

Ввод читается из globalInputText. Вы можете изменить этот пример так, чтобы глобальный входной текст представлял собой любую строку, которую вы хотите, или из любого источника ввода, который вы хотите.

parser.y:

%{
#include <stdio.h>
extern void yyerror(char* s);
extern int yylex();
extern int readInputForLexer(char* buffer,int *numBytesRead,int maxBytesToRead);
%}

%token FUNCTION_PLUS FUNCTION_MINUS NUMBER

%%

expression:
    NUMBER FUNCTION_PLUS NUMBER { printf("got expression!  Yay!\n"); }
    ;

%%

lexer.l:

%{

#include "y.tab.h"
#include <stdio.h>


#undef YY_INPUT
#define YY_INPUT(b,r,s) readInputForLexer(b,&r,s)

%}

DIGIT   [0-9]
%%

\+      { printf("got plus\n"); return FUNCTION_PLUS; }
\-      { printf("got minus\n"); return FUNCTION_MINUS; }
{DIGIT}* { printf("got number\n"); return NUMBER; }
%%


void yyerror(char* s) {
    printf("error\n");
}

int yywrap() {
    return -1;
}

myparser.c:

#include <stdio.h>
#include <string.h>

int yyparse();
int readInputForLexer( char *buffer, int *numBytesRead, int maxBytesToRead );

static int globalReadOffset;
// Text to read:
static const char *globalInputText = "3+4";

int main() {
    globalReadOffset = 0;
    yyparse();
    return 0;
}

int readInputForLexer( char *buffer, int *numBytesRead, int maxBytesToRead ) {
    int numBytesToRead = maxBytesToRead;
    int bytesRemaining = strlen(globalInputText)-globalReadOffset;
    int i;
    if ( numBytesToRead > bytesRemaining ) { numBytesToRead = bytesRemaining; }
    for ( i = 0; i < numBytesToRead; i++ ) {
        buffer[i] = globalInputText[globalReadOffset+i];
    }
    *numBytesRead = numBytesToRead;
    globalReadOffset += numBytesToRead;
    return 0;
}
6 голосов
/ 20 декабря 2009

Если вы используете реальное lex, а не flex, я думаю, вы можете просто определить свой собственный

int input(void);

Это может возвращать символы из строки или что угодно.

В качестве альтернативы, я полагаю, вы могли бы записать строку в файл и открыть файл в потоке yyin. Я подозреваю, что это будет работать с любой реализацией.

Если используется flex, то я думаю, что вы переопределяете макрос YY_INPUT(),

3 голосов
/ 16 ноября 2012

другой подход заключается в использовании yy_scan_string, как уже упоминалось в связанных ответах

0 голосов
/ 06 февраля 2011

Как было сказано ранее, это можно сделать путем переопределения input() - я использовал его в aix, hpux и solaris.

Или другой подход, который я тоже использую, это сделать трубу и использовать fdopen() -ed FILE* как yyin.

0 голосов
/ 20 декабря 2009

Вот кое-что, что должно работать с любой реализацией, хотя и рискованно использовать popen.

$ cat a.l
%%
"abc" {printf("got ABC\n");}
"def" {printf("got DEF\n");}
. {printf("got [%s]\n", yytext);}
%%
int main(int argc, char **argv)
{
    return(lex("abcdefxyz"));
}
lex(char *s)
{
    FILE *fp;
    char *cmd;
    cmd=malloc(strlen(s)+16);
    sprintf(cmd, "/bin/echo %s", s); // major vulnerability here ...
    fp=popen(cmd, "r");
    dup2(fileno(fp), 0);
    return(yylex());
}
yywrap()
{
    exit(0);
}
$ ./a
got ABC
got DEF
got [x]
got [y]
got [z]
...