Понятие «резервное копирование» довольно интересно.
Традиционно, когда данные хранились на одном диске, резервное копирование было обязательным, поскольку нехорошо иметь единственную точку отказа .
Однако Amazon S3 хранит данные на нескольких устройствах в нескольких зонах доступности (фактически, в нескольких центрах обработки данных), что обеспечивает им устойчивость 99,9999999999% и доступность 99,99% . (Обратите внимание, что долговечность означает вероятность сохранения данных, что не совсем совпадает с доступностью, что означает возможность доступа к данным. Я предполагаю, что разница в том, что во время отключения питания данные могут быть недоступны, но это не был потерян.)
Таким образом, традиционная концепция резервного копирования в случае сбоя устройства уже была обработана в S3 , и все это по стандартной цене. (Существует более старая опция Reduced Redundancy , которая копируется только в 2 AZ, а не в 3, но это больше не рекомендуется.)
Далее следует концепция резервного копирования на случай случайного удаления объектов. Когда объект удаляется в S3, он не подлежит восстановлению. Однако , включающий управление версиями в корзине, сохранит несколько версий, включая удаленные объекты . Это замечательно, когда нужно сохранить предыдущие истории объектов или когда может потребоваться отменить удаление. Недостатком является то, что затраты на хранение включают все версии , которые сохраняются.
В S3 также есть новые возможности блокировки объектов , где объекты могут быть заблокированы на период времени (например, 3 года) без возможности их удаления. Это идеально подходит для ситуаций, когда информация должна храниться в течение определенного периода, и это позволяет избежать случайного удаления. (Существует также возможность Legal Hold , которая такая же, но может быть включена / выключена, если у вас есть соответствующие разрешения.)
Наконец, существует вероятность преднамеренного злонамеренного удаления , если разгневанный сотрудник решит отомстить вашей компании за то, что он не снабдил их любимым ароматом кофе. Если у пользователя AWS есть необходимые разрешения, он может удалить данные из S3. Чтобы защититься от этого, вы должны ограничить, у кого есть такие разрешения и, возможно, объединить его с управлением версиями (чтобы они могли удалить текущую версию объекта, но она фактически сохраняется системой).
Эту проблему также можно решить с помощью Межрегиональная репликация корзин Amazon S3. Некоторые организации используют это для копирования данных в корзину, принадлежащую другой учетной записи AWS , так что никто не может удалить данные из обеих учетных записей. Это ближе к концепции истинной резервной копии, потому что копия хранится отдельно (с учетом учетной записи) от оригинала. Дополнительная стоимость хранения минимальна по сравнению с потенциальными затратами в случае потери данных. Кроме того, если вы сконфигурируете корзину реплик для использования класса хранения Glacier Deep Archive , затраты могут быть довольно низкими.
Ваша копия на Glacier является еще одной формой резервного копирования (и предлагает более дешевое хранилище, чем S3 в долгосрочной перспективе), но ее необходимо регулярно обновлять, чтобы она была постоянной (например, с помощью программного обеспечения для резервного копирования, который понимает S3 и Glacier). Стоимость «5c на 1000 запросов» означает, что она лучше используется для архивов (например, больших zip-файлов), а не для многих маленьких файлов.
Итог: Вам может потребоваться сделать резервную копию так же просто, как включить управление версиями и ограничить количество пользователей, которые могут полностью удалить объект (включая все предыдущие версии) из корзины. Или создайте реплику корзины и сохраните ее в классе хранения Glacier Deep Archive.