Допустим, у меня есть какой-то текст, и я предполагаю, что это не случайный текст, а книга или что-то в этом роде.
Я хочу сжать его - но, в отличие от кодирования Хаффмана, который кодирует каждый символ в последовательность чисел, я хочу закодировать последовательность символов (но ее длина может быть иногда одна и должна быть меньше некоторого фиксированного числа) в число , Каждая серия символов будет иметь количество (количество номеров, которые могут использовать серии, ограничено, масштаб тысячи). Затем алгоритм отсканирует текст на наличие серий и заменит каждую серию символов на свой номер.
Конечно, я хочу, чтобы алгоритм нашел лучшие эффективные серии для использования.
Есть ли известный компресс, который работает так?