Я пытаюсь извлечь и предварительно обработать данные журнала для варианта использования.
Например, журнал состоит из номеров проблем с информацией для каждого ID ниже.Каждый элемент начинается с:
#!#!#identification_number###96245#!#!#change_log###
action
action1
change
#!#!#attribute###value_change
#!#!#attribute1###status_change
#!#!#attribute2###<None>
#!#!#attribute3###status_change_fail
#!#!#attribute4###value_change
#!#!#attribute5###status_change
#!#!#identification_number###96246#!#!#change_log###
action
change
change1
action1
#!#!#attribute###value_change
#!#!#attribute1###status_change_fail
#!#!#attribute2###value_change
#!#!#attribute3###status_change
#!#!#attribute4###value_change
#!#!#attribute5###status_change
Я извлек идентификационные номера и сохранил их в виде файла .csv:
f = open(r'C:\Users\reszi\Desktop\Temp\output_new.txt', encoding="utf8")
change_log = f.readlines()
number = re.findall('#!#!#identification_number###(.+?)#!#!#change_log###', change_log)
Теперь я пытаюсь добиться того, чтобы для каждого идентификаторав файл .csv
я могу добавить соответствующий контент журнала:
action
change
#!#!#attribute###
Поскольку я довольно плохо знаком с Python и только начал работать с regex несколько дней назад, я надеялся на некоторую помощь.
Каждый журнал для идентификатора начинается с "#!#!identification_number###"
и заканчивается "#!#!attribute5### <entry>"
.
Я пробовал следующий код, но результат пуст:
In:
x = re.findall("\[^#!#!#identification_number###((.|\n)*)#!#!#attribute5###((.|\n)*)$]", str(change_log))
In:
print(x)
Out:
[]