Ошибка при разделении данных блока файла в Python - PullRequest
2 голосов
/ 14 июля 2020

Я проанализировал файл, и мне нужна помощь в разделении данных в нем. Ниже приведены мои данные:

Блок данных:

blank space
20/06/25 12:19:33 ERROR datasources
20/06/25 21:12:23 ERROR  sadasdfsd
blank space
blank space    
20/06/25 12:19:33 WARN  asda
20/06/25 21:12:23 ERROR asdasdfsd
20/06/25 12:20:33 WARN  asda
blank space

Я упомянул 'blank space' для лучшего понимания. В моих данных там будет пустое место

код, который я пробовал:

def parse_log_contents(text,full_text_lines,filter_content_types=None):
    #print(text) #Above block of data
    messages = re.compile('^(?=\d+/)',flags=re.MULTILINE).split(text)
    print(messages)

Результат, который я получил:

['']
['20/06/25 12:19:33 ERROR datasources\n20/06/25 21:12:23 ERROR  sadasdfsd']
['']
['']
['20/06/25 12:19:33 WARN  asda\n20/06/25 21:12:23 ERROR asdasdfsd\n20/06/25 12:20:33 WARN  asda']
['']

Ожидаемый результат:

['']
['', '20/06/25 12:19:33 ERROR datasources\n', '20/06/25 21:12:23 ERROR  sadasdfsd']
['']
['']
['', '20/06/25 12:19:33 WARN  asda\n','20/06/25 21:12:23 ERROR asdasdfsd\n','20/06/25 12:20:33 WARN  asda']
['']

Я использую python 2,7 дюйма Linux Среда

В моем выводе вы можете видеть, что я не смог разбить ошибки по разделителю comma(,).

Также мне нужен пустой '' перед теми сообщениями, которые мне понадобятся позже для другой обработки.

Пожалуйста, помогите мне разобраться с этой проблемой. Большое спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...