ищет создать список файлов, доступ к которым из файла журнала. Два примера строк из файла показаны ниже.
.... [08 / Mar / 2020: 19: 11: 15 -0700] "GET / socview / 15Ragged.htm HTTP / 1.1" 200 6564 ..... ....
.... [08 / Mar / 2020: 19: 11: 31 -0700] "GET / socview /? C = D; O = A HTTP / 1.1 "200 13443 ..............
/ socview / 15Ragged.htm - вот что я хочу извлечь ie. заканчиваясь на .htm .log .txt et c.
/ socview /? C = D; O = A - это то, что я пытаюсь избежать извлечения.
Кажется, что "." это вызывает проблемы, например, когда я запускаю код без его поиска, ie. RE ниже прекрасно работает как часть l oop, показанного внизу этого поста.
unique = re.search(r'GET (\S+)', x)
Однако это извлечение строк, которые я не хочу. Ниже я пытаюсь использовать l oop и RE, это имеет смысл для меня, и я не могу понять, что не так, когда запускается, отображается сообщение ниже. Любая помощь будет принята с благодарностью
", если unique.group (1) отсутствует в unilist:
AttributeError: у объекта 'NoneType' нет атрибута 'group' '
for x in input:
unique = re.search(r'GET (\S+\.\S+)', x)
if unique.group(1) not in unilist:
unilist.append(unique.group(1))