Есть статья, которая может быть интересна в этом контексте:
Эдвард Рафф, Джо Аурелио. PyLZJD: простой в использовании инструмент для машинного обучения в материалах 18-й Python научной конференции, 97-102. http://hdl.handle.net/11603/14971
Фактически он определяет метрику c для сжатых данных, которая может использоваться для L SH.