сжатие данных - машинное обучение для экспоненциального распределения - PullRequest
3 голосов
/ 14 января 2011

Существуют ли какие-либо алгоритмы машинного обучения, модели прогнозирования, которые могут помочь мне сжать экспоненциально распределенные данные? Я уже закодировал файл, используя коды Голомба, что определенно экономит тонны пространства, но этого недостаточно - мне нужно сжатие. PAQ8L недостаточно сжимает.

Пожалуйста, попросите файл, если это необходимо.

Экспоненциально распределено -

{а, Ь, Ь, а, а, б, в, с, а, а, б, а, а, б, а, с, Ь, а, б, г}

Ответы [ 2 ]

1 голос
/ 14 января 2011

Я не думаю, что это теоретически возможно. код Голомба уже оптимален для геометрически распределенных данных.

0 голосов
/ 19 июня 2016

Как упоминалось в других статьях, алгоритмы PAQ * используют алгоритм смешивания контекста. Это означает, что вы знаете больше о данных, чем просто «экспоненциально распределенные». Я думаю, что код Голомба все еще оптимален, если о данных известно только экспоненциальное распределение.

...