На самом деле это и то и другое (хотя я думаю, что Brisk сейчас превратился в коммерческий продукт, DataStax Enterprise, и сам по себе активно не разрабатывается).
Brisk включает CassandraFS (cfs), который является заменой HDFS и поэтому поддерживает большие файлы. Под капотом они разбиваются на куски и хранятся в строках / столбцах Кассандры.
Для небольших файлов вы можете хранить данные в собственных строках Cassandra вместо CassandraFS и вместо этого запускать задания Hadoop над строками.