Мне нужно искать решения для предоставления базы данных MySQL, которая может обрабатывать объемы данных в диапазоне терабайт и быть высокодоступной (пять девяток). Каждая строка базы данных, вероятно, будет иметь метку времени и до 30 значений с плавающей запятой. Ожидаемая рабочая нагрузка - до 2500 вставок / сек. Запросы, вероятно, будут менее частыми, но могут быть большими (возможно, с использованием 100 ГБ данных), хотя, вероятно, только с отдельными таблицами.
Я смотрел на MySQL Cluster, учитывая, что это их HA-предложение. Из-за объема данных мне нужно будет использовать дисковое хранилище. Реально я думаю, что только временные метки могут храниться в памяти, а все остальные данные должны храниться на диске.
Есть ли у кого-нибудь опыт использования MySQL Cluster в базе данных такого масштаба? Это даже жизнеспособно? Как дисковое хранилище влияет на производительность?
Я также открыт для других предложений о том, как добиться желаемой доступности для этого объема данных. Например, было бы лучше использовать стороннюю библиотеку, такую как Sequoia , для обработки кластеризации стандартных экземпляров MySQL? Или более прямолинейное решение, основанное на репликации MySQL?
Единственное условие - это решение на основе MySQL. Я не думаю, что MySQL - лучший способ получить данные, с которыми мы имеем дело, но это жесткое требование.