для личного проекта. Я ищу «наиболее подходящий» механизм базы данных для решения следующих ключевых проблем.
- необходимо хранить большое количество отдельных файлов документов (PDF)
- необходимо выполнить полнотекстовый поиск в PDF (для этого я планирую использовать OCR и сохранить обработанные данные / метаданные дополнительно в базу данных)
- необходимо получить куски / порции сохраненных документов (например, от указанного c года) и покажите предварительный просмотр множества из них в приятном веб-интерфейсе
- максимально возможной производительности
До сих пор я много работал с SQL (MySql) и некоторые теоретические знания о других системах (MemCached, Redis, PostgreSQ, MongoDb). Но я никогда не использовал их в комбинации и никогда не достигал точки, КОГДА они должны использоваться для ЧТО именно или как их можно комбинировать.
Я думаю, что особенно для такого проекта очень важно выбрать правильный двигатель от начала, чтобы не поражать проблемы производительности позже. Поэтому, особенно для всех опытных разработчиков, какой ваш любимый выбор для такого рода (я полагаю, SQL может быть не единственно правильным решением)? Или, в конце концов, будет лучше хранить файлы в файловой системе и хранить только метаданные в базе данных?
Кстати, мой запланированный бэкэнд API для этого будет Laravel 7+, внешний интерфейс будет Vue 2 +.
Большое спасибо!