Я пишу скрипт на Python для извлечения данных из нашего журнала доступа Apache на 2 ГБ. Вот одна строка из журнала.
81.52.143.15 - - [01/Apr/2008:00:07:20 -0600] "GET /robots.txt HTTP/1.1" 200 29 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; fr; rv:1.8.1) VoilaBot BETA 1.2 (http://www.voila.com/)"
Я пытаюсь получить часть даты из этой строки, и регулярное выражение подводит меня, и я не знаю почему. Вот мой код Python:
l = 81.52.143.15 - - [01/Apr/2008:00:07:20 -0600] "GET /robots.txt HTTP/1.1" 200 29 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; fr; rv:1.8.1) VoilaBot BETA 1.2 (http://www.voila.com/)"
re.match(r"\d{2}/\w{3}/\d{4}", l)
ничего не возвращает. Также не делают следующее:
re.match(r"\d{2}/", l)
re.match(r"\w{3}", l)
или что-нибудь еще, что я могу даже получить часть даты. Что я недопонимаю?