Расчет дельта-времени из файла журнала с использованием python - PullRequest
0 голосов
/ 07 августа 2020

Я застрял, пытаясь найти дельту первой и последней отметки времени из файла журнала

Вот раздел файла журнала

[2020-07-31 15:49:22,015][SRC.Env][I]:Reading 
[2020-07-31 15:49:22,015][SRC.Env][I]:Finished Initilization 
[2020-07-31 15:49:22,052][SRC][I]:Creating link
[2020-07-31 15:49:22,053][SRC][I]:Starting
.
.
.
[2020-08-03 09:17:29,351][SRC.Upload][I]:Finished

Вот что я сделано до сих пор

import re
from dateutil import parser

with open('run.log') as run_log:
  times = [re.findall(r'\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2},\d{3}',
      line) for line in run_log.readlines() if 'SRC' in line]
print(times)

time_delta = parser.parse(times[-1]) - parser.parse(times[0])
print(time_delta)

Когда я печатаю время, оно показывало все время (как и ожидалось) [['2020-07-31 15:49:22,011'], ['2020-07-31 15:49:22,015'],...['2020-08-03 09:17:29,351']]

Однако когда я пытаюсь вычесть первый раз В последний раз я получаю следующую ошибку:

    return DEFAULTPARSER.parse(timestr, **kwargs)
  File "C:\Program Files (x86)\Microsoft Visual Studio\Shared\Python36_64\lib\site-packages\dateutil\parser\_parser.py", line 646, in parse
    res, skipped_tokens = self._parse(timestr, **kwargs)
  File "C:\Program Files (x86)\Microsoft Visual Studio\Shared\Python36_64\lib\site-packages\dateutil\parser\_parser.py", line 725, in _parse
    l = _timelex.split(timestr)         # Splits the timestr into tokens
  File "C:\Program Files (x86)\Microsoft Visual Studio\Shared\Python36_64\lib\site-packages\dateutil\parser\_parser.py", line 207, in split
    return list(cls(s))
  File "C:\Program Files (x86)\Microsoft Visual Studio\Shared\Python36_64\lib\site-packages\dateutil\parser\_parser.py", line 76, in __init__
    '{itype}'.format(itype=instream.__class__.__name__))
TypeError: Parser must be a string or character stream, not list

Я решил научиться программировать около двух месяцев go, так что любая помощь действительно поможет мне в прогрессе. Спасибо :)

1 Ответ

0 голосов
/ 07 августа 2020

Проблема в том, что re.findall () возвращает list.

Вы можете получить доступ к одному элементу, используя re.findall(pattern, s)[0]

import re
from dateutil import parser

with open('run.log') as run_log:
    times = [re.findall(r'\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2},\d{3}',
                        line)[0] for line in run_log.readlines() if 'SRC' in line]
print(times)

time_delta = parser.parse(times[-1]) - parser.parse(times[0])
print(time_delta)

Выход:

['2020-07-31 15:49:22,015', '2020-07-31 15:49:22,015', '2020-07-31 15:49:22,052', '2020-07-31 15:49:22,053', '2020-08-03 09:17:29,351']
2 days, 17:28:07.336000
...