Это действительно зависит от типа данных, о которых вы говорите, но общей стратегией было бы использование Snowball для передачи всех массовых данных до определенного момента времени, и с этого момента начала отправлять данные, которые попадают в ваш дата-центр в AWS напрямую по сети.
Проблема, которую Snowball решает, - это передача больших объемов данных, которые не будут эффективными по сети, но для всех новых данных вы можете отправить копию в AWS в режиме реального времени или через регулярные промежутки времени. Размер этих данных должен быть достаточно мал, чтобы передача по сети работала нормально.
Относительно миграции данных AWS имеет много разных сервисов , и это действительно зависит от ваших конкретных требований.
Очень распространенная настройка - использовать как минимум прямое соединение, чтобы вы могли иметь выделенное соединение с центрами обработки данных Amazon. Если ваши данные достаточно малы, вы можете просто использовать простые инструменты для отправки данных на S3 или в пожарный шланг кинезиса.
В более сложных сценариях может потребоваться шлюз хранилища, который находится в вашем центре обработки данных и обеспечивает бесшовную интеграцию со многими хранилищами данных и файлов в AWS.
Таким образом, детали будут зависеть от каждого варианта использования, но ответом будет сочетание технологий, упомянутых на странице Cloud Data Migration