Используйте Pandas для чтения журналов Cloudfront - PullRequest
0 голосов
/ 14 апреля 2020

Я хотел бы позвонить pd.read_table(), чтобы принять журналы, сгенерированные Amazon Cloudfront и отформатированные как расширенные файлы журналов ( ELF ).

Первые две строки выглядят так:

#Version: 1.0
#Fields: date time x-edge-location sc-bytes c-ip cs-method cs(Host) cs-uri-stem sc-status cs(Referer) cs(User-Agent) cs-uri-query cs(Cookie) x-edge-result-type x-edge-request-id x-host-header cs-protocol cs-bytes time-taken x-forwarded-for ssl-protocol ssl-cipher x-edge-response-result-type cs-protocol-version fle-status fle-encrypted-fields c-port time-to-first-byte x-edge-detailed-result-type sc-content-type sc-content-len sc-range-start sc-range-end

Имена столбцов следуют после #Fields:

Я знаю, что могу начать читать заголовок во второй строке следующим образом: pd.read_table(fname, header=1)

Но как Я игнорирую #Fields: и начинаю читать столбцы после этого? Я не могу понять, что это возможно из Pandas документации . Я что-то упустил или эта возможность не существует?

...