Перенос большого набора данных на s3 - PullRequest
0 голосов
/ 13 апреля 2011

Я пытаюсь переименовать и перенести 2 ТБ (10 миллионов) изображений с локального сервера на Amazon S3.Я написал PHP для отправки их с помощью библиотеки aws (работающей на той же локальной машине), но у меня нет 6 месяцев, которые он хочет закончить.Нужны идеи, как сделать это быстрее.

У меня есть 2 идеи, но я не уверен, что они будут лучше .... 1. Используйте некоторое смонтированное решение s3 (s3fs), которое будет параллельно загружать (не так ли?) 2. Потяните изображения наЭкземпляр ec2 и отправьте на s3 оттуда.Я мог бы вытащить их с помощью ssh / FTP или http.Тем не менее, вероятно, нужно распараллелить их вручную ??

Любая помощь будет оценена.

Ответы [ 2 ]

4 голосов
/ 13 апреля 2011

Другая возможность - отправить Amazon жесткий диск с вашими данными.

0 голосов
/ 13 апреля 2011

Разделите ваш список более 10 миллионов изображений на подмножества.Загружайте каждое подмножество в S3 параллельно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...