Я создаю систему синтаксического анализа журналов на основе веб-технологий, используя Ruby on Rails. Я уже завершил функцию загрузки файлов журнала, и у меня также есть выражение Regex для сбора необходимой мне информации из каждой записи файла журнала. Как вы знаете, файл журнала может содержать тысячи записей файла журнала, и они обычно следуют одному и тому же шаблону.
Например:
Processing NameofController#index (for 999.999.999.999 at 2019-01-24 00:12:00) [GET]
Session ID: aaaaaabbbbbbcccccc11112222333
Parameters: {"controller"=>"sample_invoices", "action"=>"index",
"before"=>"2019-01-24T12:00:00Z", "soap_id"=>"0001",
"s"=>"sample", "format"=>"xml"}
Sample chain halted as [:example] rendered_or_redirected.
Completed in 0.00022 (4588 reqs/sec) | Rendering: 0.00010 (44%) | DB: 0.00000 (0%) | 401 Unauthorized [http://www.iwantsoaps.com/pages/sample.xml?s=sample&soap_id=0001&before=2019-01-24T12:00:00Z]
Может ли кто-нибудь порекомендовать мне способ чтения каждого файла журнала с помощью регулярных выражений после их загрузки? Я просто не знаю с чего начать. Мне также нужно хранить захваченные значения в базе данных.