Документация находится здесь:
http://wiki.apache.org/cassandra/HadoopSupport
Хотя я не уверен, что назвал бы это исчерпывающим руководством. Если у вас уже настроены кластеры кассандры и кластеры hadoop, лучше всего начинать с них, а затем задавать вопросы (irc, список рассылки и т. Д.). Если вы новичок в cassandra или hadoop, я бы начал с ознакомления с этими проектами отдельно, прежде чем пытаться соединить их.
Существует также продукт DataStax Enterprise (http://www.datastax.com/products/enterprise), который объединяет Hadoop и Cassandra в одном приложении. http://www.datastax.com/docs/1.0/datastax_enterprise/index
ОТКАЗ ОТ ОТВЕТСТВЕННОСТИ: Вы должны заметить, что я работаю для DataStax и что DataStax Enterprise не является открытым исходным кодом и не бесплатен (хотя он бесплатен для разработки / непроизводственного использования).