Учебник по дереву суффиксов токенов - PullRequest
1 голос
/ 18 ноября 2009

Может кто-нибудь указать на учебники по теме "Деревья суффиксов токенов".

Ответы [ 2 ]

0 голосов
/ 06 июня 2010

Не уверен, что это то, что вы ищете, но ваш вопрос напоминает мне о том, что я знаю как «деревья суффиксов в словах», например, http://www.larsson.dogma.net/words-alg.pdf

0 голосов
/ 18 ноября 2009

По поиску этой же фразы и сканированию первой пары результатов, я предполагаю, что они говорят о дереве суффиксов, в котором "буквы" (или "символы", или "элементы") не являются отдельными ASCII или UNICODE символы, к которым мы привыкли, а скорее лексические жетоны какого-то компьютерного языка.

Так, например, для C у вас будет «буква» с именем int, а другая буква с именем ( и так далее. Я не уверен, как именно будут обрабатываться токены, которые являются подпоследовательностями других токенов (например, + - это подпоследовательность ++), но я предполагаю, что они обрабатываются так же, как лексер обрабатывает их, который (по крайней мере для C) всегда жадно собирает самый длинный токен (например, 5 входных символов +++++ будут помечены как ++, ++, +).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...