По поиску этой же фразы и сканированию первой пары результатов, я предполагаю, что они говорят о дереве суффиксов, в котором "буквы" (или "символы", или "элементы") не являются отдельными ASCII или UNICODE символы, к которым мы привыкли, а скорее лексические жетоны какого-то компьютерного языка.
Так, например, для C у вас будет «буква» с именем int
, а другая буква с именем (
и так далее. Я не уверен, как именно будут обрабатываться токены, которые являются подпоследовательностями других токенов (например, +
- это подпоследовательность ++
), но я предполагаю, что они обрабатываются так же, как лексер обрабатывает их, который (по крайней мере для C) всегда жадно собирает самый длинный токен (например, 5 входных символов +++++
будут помечены как ++
, ++
, +
).