В настоящее время мы сталкиваемся с проблемой эффективного хранения и извлечения данных из очень больших наборов данных (в миллиарды).Мы использовали mysql и оптимизировали систему, операционную систему, raid, запросы, индексы и т. Д., И теперь надеемся двигаться дальше.
Мне нужно принять взвешенное решение о том, какую технологию использовать для решения наших проблем с данными.Я исследовал карту / уменьшение с HDFS, но также слышал хорошие вещи о HBase.Я не могу помочь, но думаю, что есть и другие варианты.Есть ли хорошее сравнение доступных технологий и каковы их компромиссы?
Если у вас есть ссылки на каждую из них, я был бы также признателен за это.