Описание проблемы
Вот текстовый шаблон, который у меня есть:
05.04.0090
1
erhältlichen Tableau Interfaces
lassen sich zusätzliche GLT-Kontakte
aufschalten. Das System kann
die zwei Szenarien-Modi "Urlaub" und
Abwesenheit" verwalten. Für beide
Modi können bestimmte Parameter
programmiert werden.
Das WAREMA climatronic Bediengerät
kann preisgleich auch
in den Farben "schwarz" oder
"schwarz/silber" geliefert werden.
Liefern und montieren. 882,75 882,75
В приведенном выше текстовом блоке есть item_code
, в котором есть эта норма для записи 05.04.0090
затем внизу идет подсчет элемента 1
, затем следует description of product
, затем unit price
в этом случае EU 882,75
и в итоге итоговое значение sum
, равное 882,74
Что я хочу Я хочу сделать из него пары ключ-значение, например dict[{'item_code':'5.04.009','quant':'1','description':'TEXT','unit_price':'882,74','Total_sum':'88,75'}]
В конце я буду использовать этот шаблон в просторе для распознавания сущностей. Любое предложение относительно простоты было бы также замечательно
Что я пробовал?
pat= re.search(r'\d(.*?)\d',text,re.M)
print(pat.group())
Помощь или предложение будут оценены.