Я новичок в Python и пытаюсь проанализировать некоторые данные, используя pyparsing, который выглядит следующим образом
string2 = """
object1 {
key1 = value1
key2 = value2
#key3 = value3
key4 = value4
#key5 = value5
key6 = value6
subobject1 {
key1 = value1
key2 = value2
key3 = value3
}
}
"""
И я могу получить пару ключ = значение, используя этот код
def parse_objects(source):
LBRACE,EQ,RBRACE,HASH = map(Suppress, '{=}#')
object_name = Word(printables)
#disable = MatchFirst(map(Literal, '#'.split()))
key = Word(printables)
value = Word(printables)
if LineStart() == HASH:
key_and_value = Group(HASH + key('key') + EQ + value('value'))
else:
key_and_value = Group(key('key') + EQ + value('value'))
collection = Forward()
object_body = Group(LBRACE + ZeroOrMore(collection | key_and_value) + RBRACE)
collection <<= Group(object_name + object_body)
return collection.parseString(source)
collection = parse_objects(string2)
print(collection.dump())
Но мне также нужно проанализировать данные, которые не содержат значений в объектах, только ключи. Например
object1 {
key1 = value1
key2
#key3 = value3
key4
#key5 = value5
key6 = value6
subobject1 {
key1 = value1
key2 = value2
key3 = value3
}
}
Я попытался внести изменения в код и добавить проверочное выражение if value is None
.
Как то так
if value is None:
key_and_value = Group(key('key'))
else:
if LineStart() == HASH:
key_and_value = Group(HASH + key('key') + EQ + value('value'))
else:
key_and_value = Group(key('key') + EQ + value('value'))
но я получаю ошибку
Match W:(0123...) at loc 19(3,9)
Matched W:(0123...) -> ['key1']
Match W:(0123...) at loc 25(3,15)
Matched W:(0123...) -> ['value1']
Match W:(0123...) at loc 41(4,9)
Matched W:(0123...) -> ['key2']
Traceback (most recent call last):
File "c:\Python27\my_projects\test_parser.py", line 86, in <module>
collection = parse_objects(string2)
File "c:\Python27\my_projects\test_parser.py", line 84, in parse_objects
return collection.parseString(source)
File "C:\Python27\lib\site-packages\pyparsing.py", line 1632, in parseString
raise exc
ParseException: Expected "}" (at char 41), (line:4, col:9)
Я думаю, что pyparsing принимает ключ как подобъект и не находит {
.
Кто-нибудь может дать мне какие-нибудь советы? Может быть, мне нужно изменить свой подход к грамматике?
Я ценю любую помощь.
Редактировать 1
@ Решение Jappy отлично работает для данных, которые я написал выше, когда раздел subobject1 находится внизу основного раздела. Проанализировав мои данные, я обнаружил, что после раздела subobject1 может быть больше пар ключ = значение или только ключи, что-то вроде этого:
string2 = """
object1 {
key1 = value1
key2
#key3 = value3
key4 = value4
subobject1 {
key1 = value1
key2 = value2
key3 = value3
}
#key5 = value5
key6 = v_a_l_u_e_6
subobject2 {
key1 = value1
}
key7 = value7
key8
}
"""
Вывод будет следующим:
[['object1', ['key1', 'value1'], ['key2', 'null'], ['#key3', 'value3'], ['key4', 'value4'], ['subobject1', ['key1', 'value1'], ['key2', 'value2'], ['key3', 'value3']], ['#key5', 'value5'], ['key6', 'v_a_l_u_e_6'], ['subobject2', ['key1', 'value1']], ['key7', 'value7'], ['key8', 'null']]]
- objects: ['object1', ['key1', 'value1'], ['key2', 'null'], ['#key3', 'value3'],
['key4', 'value4'], ['subobject1', ['key1', 'value1'], ['key2', 'value2'], ['key3', 'value3']], ['#key5', 'value5'], ['key6', 'v_a_l_u_e_6'], ['subobject2', ['key1', 'value1']], ['key7', 'value7'], ['key8', 'null']]
- key_val_lines: [['key7', 'value7'], ['key8', 'null']]
[0]:
['key7', 'value7']
- key: 'key7'
- val: 'value7'
[1]:
['key8', 'null']
- key: 'key8'
- val: 'null'
- obj_name: 'object1'
- objects: ['subobject2', ['key1', 'value1']]
- key_val_lines: [['key1', 'value1']]
[0]:
['key1', 'value1']
- key: 'key1'
- val: 'value1'
- obj_name: 'subobject2'
Я изменил код следующим образом:
ParserElement.inlineLiteralsUsing(Suppress)
name_expr = Word(printables, excludeChars='{}')
key_val_expr = '=' + Word(printables)
key_val_line = Group(name_expr('key') + (lineEnd().setParseAction(lambda t: 'null') | key_val_expr)('val'))
#key_val_lines = OneOrMore(key_val_line)('key_val_lines')
obj = Forward()
objects = Group('{' + OneOrMore(key_val_line | obj) + '}')
obj << Group(name_expr('obj_name') + objects('objects'))
#obj << Group(name_expr('obj_name') + '{' + OneOrMore(key_val_lines | obj) + '}')('objects')
o = obj.parseString(string2)
print o.dump()
И результат:
[['object1', [['key1', 'value1'], ['key2', 'null'], ['#key3', 'value3'], ['key4',
'value4'], ['subobject1', [['key1', 'value1'], ['key2', 'value2'], ['key3', 'value3']]], ['#key5', 'value5'], ['key6', 'v_a_l_u_e_6'], ['subobject2', [['key1', 'value1']]], ['key7', 'value7'], ['key8', 'null']]]]
[0]:
['object1', [['key1', 'value1'], ['key2', 'null'], ['#key3', 'value3'], ['key4', 'value4'], ['subobject1', [['key1', 'value1'], ['key2', 'value2'], ['key3', 'value3']]], ['#key5', 'value5'], ['key6', 'v_a_l_u_e_6'], ['subobject2', [['key1', 'value1']]], ['key7', 'value7'], ['key8', 'null']]]
- obj_name: 'object1'
- objects: [['key1', 'value1'], ['key2', 'null'], ['#key3', 'value3'], ['key4',
'value4'], ['subobject1', [['key1', 'value1'], ['key2', 'value2'], ['key3', 'value3']]], ['#key5', 'value5'], ['key6', 'v_a_l_u_e_6'], ['subobject2', [['key1', 'value1']]], ['key7', 'value7'], ['key8', 'null']]
[0]:
['key1', 'value1']
- key: 'key1'
- val: 'value1'
[1]:
['key2', 'null']
- key: 'key2'
- val: 'null'
[2]:
['#key3', 'value3']
- key: '#key3'
- val: 'value3'
[3]:
['key4', 'value4']
- key: 'key4'
- val: 'value4'
[4]:
['subobject1', [['key1', 'value1'], ['key2', 'value2'], ['key3', 'value3']]]
- obj_name: 'subobject1'
- objects: [['key1', 'value1'], ['key2', 'value2'], ['key3', 'value3']]
[0]:
['key1', 'value1']
- key: 'key1'
- val: 'value1'
[1]:
['key2', 'value2']
- key: 'key2'
- val: 'value2'
[2]:
['key3', 'value3']
- key: 'key3'
- val: 'value3'
[5]:
['#key5', 'value5']
- key: '#key5'
- val: 'value5'
[6]:
['key6', 'v_a_l_u_e_6']
- key: 'key6'
- val: 'v_a_l_u_e_6'
[7]:
['subobject2', [['key1', 'value1']]]
- obj_name: 'subobject2'
- objects: [['key1', 'value1']]
[0]:
['key1', 'value1']
- key: 'key1'
- val: 'value1'
[8]:
['key7', 'value7']
- key: 'key7'
- val: 'value7'
[9]:
['key8', 'null']
- key: 'key8'
- val: 'null'
Но я не мог setResultsName
вместо группы [0]
index:
obj << Group(name_expr('obj_name') + objects('objects'))('section')
возвращает неверный результат.