Я пытаюсь реализовать Блочную сортировку. В документе «Преобразование Барроуза Уилера» для сортировки блоков необходимо добавить количество символов EOF в исходную строку S, где EOF отсутствует в S.
Но так как я буду обрабатывать двоичные файлы, возможна любая возможная комбинация битов, поэтому я не могу заранее выбрать один символ EOF, который, я уверяю, не будет в S.
Как мне решить эту проблему?
Поскольку этот символ EOF используется для сортировки суффиксов на шаге, я прочитал, что вы можете сортировать дерево суффиксов без необходимости использования этого символа EOF. Стоит ли использовать вместо этого дерево суффиксов?