Я пытаюсь установить, подходит ли Amazon SimpleDB для подмножества данных, которые у меня есть.
У меня есть тысячи развернутых автономных сенсорных устройств, которые записывают данные.
Каждое сенсорное устройство, по существу, сообщает пару значений четыре раза в час каждый день в течение месяцев и лет. Мне нужно сохранить все эти данные для исторического статистического анализа. Как правило, это написать один раз, читать много раз. Серверные приложения регулярно запускаются для запроса данных, чтобы вывести другую информацию.
Сегодня строки данных в SQL выглядят примерно так:
- (идентификатор, идентификатор_устройства, utc_timestamp, значение1, значение2)
Наше существующее решение MySQL не будет расширяться с десятками миллионов строк. Мы запрашиваем такие вещи, как « подскажите мне сумму всех значений1 вчера » или « покажите мне среднее значение value2 за последние 8 часов ». Мы делаем это в SQL, но можем с радостью перейти на код. SimpleDBs "возможная согласованность" выглядит хорошо для наших целей.
Я читаю все, что могу, и собираюсь начать экспериментировать с нашей учетной записью AWS , но мне не ясно, как соотносятся различные концепции SimpleDB (элементы, домены, атрибуты и т. Д.) в наш домен.
Является ли SimpleDB подходящим средством для этого и каким будет обобщенный подход?
PS: Мы в основном используем Python, но это не должно иметь значения при рассмотрении этого вопроса на высоком уровне. На данный момент мне известна библиотека boto .
Edit:
Продолжая искать решения для этого, я наткнулся на вопрос переполнения стека Какое лучшее решение с открытым исходным кодом для хранения данных временных рядов? , которое было полезно.