Вы, похоже, имеете в виду «базу данных документов», но этот термин не является термином искусства.
«База данных документов» может быть:
- база данных с большим столбцом текстового поля и полнотекстовым индексом.
- база данных XML, такая как MarkLogic или SoftwareAG
- сложная схема SQL, которая моделирует документ как множество маленьких кусочков.
Существуют более или менее эффективные архитектуры и стратегии индексации для всех этих. Только последний использует обычные индексы SQL. В полнотекстовой поддержке используются инвертированные индексы терминов, например, реализованные Lucene для быстрого поиска произвольных терминов. Базы данных XML строят индексы по выражениям XPath.