Если мы индексируем по (текст, слово в тексте), индекс с местоположением в тексте будет:
I (1, 1); (2,1); (3,1)
saw (1, 2); (2,2); (3,2)
the (1, 3); (1, 6); (2,3); (2,6); (3,3); (3,6); (3,10)
cat (1, 4); (3,4)
on (1, 5); (2,5); (3,9)
mat (1, 7); (2,7); (3,11)
dog (2,4)
and (3,5)
rat (3,7)
sat (3,8)
Слово «I» в документе 1 («Я видел кота на коврике») начинается со слова 1, поэтому есть запись (1, 1) и Слово «кошка» находится в документе 1 и 3 в позиции «4» соответственно (здесь позиция основана на слове). Индекс может иметь веса, частоты или другие показатели.