Но что мешает cloudera сделать его частью их распространения? Или это случилось?
Оба Apache Hadoop и Cloudera CDH выпущены под одной и той же общественной лицензией Apache версии 2, поэтому я не думаю, что LZO может быть включен в CDH из-за ограничений GPL.
Короче, как заставить lzo сжатие произойти на cloudera cdh3u2?
Я не пробовал их, но вот инструкции по использованию LZO с Hadoop.