Мы определяем систему, которая будет индексировать и хранить миллионы сообщений Syslog. Это текстовые сообщения с несколькими атрибутами (имя системы, дата / время, тип сообщения, тело сообщения), которые обычно имеют размер от 100 до 1500 байт каждое.
Мы генерируем от 2 до 10 ГБ этих сообщений в день, и нам нужно хранить их не менее 30 дней.
Система Spunk имеет действительно великолепную систему индексации и сжатия документов.
Что использовать?
Я подумал о mongodb, но он кажется неуместным для документов такого маленького размера.
SQL Server возможен, но, возможно, не очень эффективен для этой цели.
Текстовые файлы с lucene?
- Файловая система Windows не всегда любит директории с миллионами файлов
Предложения?
Спасибо!