Как сжимать текст на уровне строки? - PullRequest
0 голосов
/ 14 июня 2019

Допустим, у меня есть какой-то текст, и я предполагаю, что это не случайный текст, а книга или что-то в этом роде. Я хочу сжать его - но, в отличие от кодирования Хаффмана, который кодирует каждый символ в последовательность чисел, я хочу закодировать последовательность символов (но ее длина может быть иногда одна и должна быть меньше некоторого фиксированного числа) в число , Каждая серия символов будет иметь количество (количество номеров, которые могут использовать серии, ограничено, масштаб тысячи). Затем алгоритм отсканирует текст на наличие серий и заменит каждую серию символов на свой номер. Конечно, я хочу, чтобы алгоритм нашел лучшие эффективные серии для использования. Есть ли известный компресс, который работает так?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...