У меня есть следующий скрипт peg.js:
start = name*
name = '** name ' var ws 'var:' vr:var ws 'len:' n:num? ws 'label:' lb:label? 'type:' ws t:type? '**\n'
{return {NAME: vr,
LENGTH: n,
LABEL:lb,
TYPE: t
}}
type = 'CHAR'/'NUM'
var = $([a-zA-Z_][a-zA-Z0-9_]*)
label = p:labChar* { return p.join('')}
labChar = [^'"<>|\*\/]
ws = [\\t\\r ]
num = n:[0-9]+ {return n.join('')}
для анализа:
** name a1 var:a1 len:9 label:The is the label for a1 type:NUM **
** name a2 var:a2 len: label:The is the label for a2 type:CHAR **
** name a3 var:a3 len:67 label: type: **
, и я столкнулся с парой проблем.
Во-первых, в тексте, который я анализирую, я ожидаю определенных меток значений, таких как 'var:', 'len:', 'label:' & 'type:'.Я хотел бы использовать эти метки, поскольку я знаю, что они являются фиксированными, для разграничения значений.
Во-вторых, мне нужно учесть пропущенные значения.
Собираюсь ли я по этому поводуправильный путь?В настоящее время мой сценарий объединяет значение метки с типом, а затем я получаю сообщение об ошибке:
Line 1, column 64: Expected "type:" or [^'"<>|*/] but "*" found.
Кроме того, можно ли сделать это также с блоками текста?Я попытался разобрать:
** name a1 var:a1 len:9 label:The is the label for a1 type:NUM **
** name a2 var:a2 len: label:The is the label for a2 type:CHAR **
randomly created text ()= that I would like to keep
** name b1 var:b1 len:9 label:This is the label for b1 type:NUM **
** name b2 var:b2 len: label:This is the label for b2 type:CHAR **
more text
, изменив первую строку, добавив следующее:
start = (name/random)*
random = r:.+ (!'** name')
{return {RANDOM: r.join('')}}
Я получаю конечный результат:
[
[{
"NAME": "a1",
"LENGTH": "9",
"LABEL": "The is the label for a1",
"TYPE": "NUM"
},
{
"NAME": "a2",
"LENGTH": null,
"LABEL": "The is the label for a2",
"TYPE": "CHAR"
},
{"RANDOM":"randomly created text ()= that I would like to keep"}]
[{
"NAME": "b1",
"LENGTH": "9",
"LABEL": "This is the label for b1",
"TYPE": "NUM"
},
{
"NAME": "b2",
"LENGTH": null,
"LABEL": "This is the label for b2",
"TYPE": "CHAR"
},
{"RANDOM":"more text "}]
]