Почему bcolz ctable сжатый размер больше, чем несжатый размер? - PullRequest
0 голосов
/ 08 апреля 2019

Я читаю в csv-файле, чтобы создать фрейм данных pandas, а затем создаю bcolz ctable из этого фрейма данных.По какой-то причине несжатый размер ctable (ctable.nbytes) значительно больше, чем сжатый размер (ctable.cbytes).

Я подумал, что, возможно, мои данные не были хорошим кандидатом на сжатие, поэтому ясоздал csv для проверки, где половина строк содержит в основном 0 в каждом столбце, а другая половина содержит в основном 1. Проблема все та же.

Я также установил уровень сжатия на недопустимое число, которое должнобросить исключение, и это не так.Как будто он даже не пытается сжать данные.

Так как этот пример опирается на определенный файл CSV, я создал пример на github: https://github.com/danbritt/bcolz-test

Из того, что я прочитал вВ документах и ​​при просмотре некоторых руководств должен быть уровень сжатия: ctable.cbytes меньше, чем ctable.nbytes.

Любое понимание того, что может происходить, будет очень полезным.

...