Я хочу разобрать текстовый файл, например, что-то вроде этого:
div::
class:yo-d
text:example
id:my-class
h1:: Title
href:http://www.example.com
div::
class:class1
id:my-class2
Это похоже на reStructuredText.
Каждый тег заканчивается ::
и может иметь некоторые атрибуты attr:value
.
Я хочу получить что-то вроде этого, словарь Python:
{'div': {'attrs': {'text': 'example', 'class': 'yo-d', 'id': 'my-class'},
'sub': {'h1': {'content': 'Title', 'attrs': {'href': 'http://www.example.com'}},
'div': {'attrs': {'class': 'class1', 'id': 'my-class2'}},
},
}
}
После sub имеются теги с отступом, и если что-то следует за тегом ::
, оно входит в 'content'
.
Я бы использовал Lepl, но я даже не знаю, с чего начать, какие-либо предложения?
Спасибо
рубик