Большие файлы журнала в виде HTML-файла, получить информацию из него - PullRequest
0 голосов
/ 19 сентября 2018

У меня есть один вопрос.Я получил большой файл журнала html от нашего административного отдела> 600 Мб.Мне нужна информация из этого.Он отображает использование процессора с датой и временем, а также некоторые другие сведения, поступающие с веб-сервера и инструмента KS-Soft HostMonitor.

Мне нужны только дата / время и процессор для создания диаграммы.HTML-файл отформатирован в виде таблицы с и.

Как мне это сделать?Я попытался импортировать его в Excel, но это не сработало, и «файл не читается» была ошибка, показанная.Файл меньшего размера с 40 Мб был успешно импортирован.

Есть ли у вас какие-либо идеи для инструментов, извлечения или программирования?Я искал в Google и нашел только те решения, которые соответствуют моим потребностям, с помощью txt или csv файлов.

...