У меня много журнальных данных, связанных с оповещениями на компьютерной платформе.Каждая запись в журнале представляет предупреждение, но несколько одинаковых предупреждений могут быть запущены для одного события за определенный промежуток времени (либо потому, что событие остается нерешенным с течением времени, либо потому, что событие было разрешено, но затем возвращено снова).По сути, у меня есть 2 основные таблицы данных.Первая - это таблица предупреждений.Вторая таблица отслеживает изменения в оповещениях (в основном это таблица истории оповещений).Идентификатор предупреждения используется в качестве внешнего ключа для доступа к таблице истории предупреждений (в сущности, создается связь 1-ко-многим между таблицами предупреждений и истории предупреждений).
Я хочу иметь возможность анализироватьоповещать данные и разумно находить закономерности в данных.Поэтому я подумал об использовании машинного обучения для этого.Нет конкретного вопроса, который нужно решить, просто поиск паттернов.Например, изучая историю предупреждений для конкретного предупреждения, алгоритм ML может обнаружить, что предупреждения запускаются только в течение определенного периода времени дня или что предупреждения приходят только из определенного географического региона.
Могу ли я получить совет, по которому ML algorithms
может быть полезным для этого?
Было бы также невероятно полезно, если бы кто-то мог посоветовать, какую базу данных можно использовать для хранения данных, поскольку существует множествоОтношение один к одному между некоторыми полями данных. ElasticSearch? Hadoop? Я могу экспортировать данные в базу данных non-RDBMS
.