HDFS, предназначенная для пакетной обработки (вы знаете, когда вы запускаете запрос, который будет читать многие из ваших файлов по одному), но действительно отстой, когда вы выполняете операции произвольного доступа, и это больно в шею поддерживать его или даже развернуть (вы знаете, все эти Zookepers, Namenodes и так далее). С другой стороны, GridFS работает медленнее в пакетном режиме, но не в том случае, когда вы делаете много случайных обращений, но у вас больше издержек на хранение по сравнению с HDFS.
Я бы сказал, что вы должны использовать HDFS для analitycs и GridFS для поддержки веб-сайта.