У меня есть проект, который требует хранения нескольких десятков TBs
данных.Сначала будет сохранено несколько TBs
данных.Затем ожидается, что данные будут расти со скоростью 5 GB
в день.
Основываясь на бизнес-логике, я могу разделить это на 10,000s
файлов / таблиц (каждый файл / таблица будет состоять из данных размером ~ 1 [GB]
).
( Примечание: в любой данный момент времени только 10-20 [GB]
(скажем, 20 таблиц) считаются hot data
, к которым я буду активно запрашивать.)
Можно ли Amazon Web Services (AWS) использовать для хранения и запроса такого огромного количества данных?
Если вместо этого я бы хотел хранить эти данные внутри компании, что это такое?лучший способ приблизиться к этому (например, ясно, что я не могу хранить все данные на одной машине и т. д.)?