Azure Архив Операции и ценообразование - PullRequest
1 голос
/ 19 марта 2020

Мы планируем переместить примерно 1 ПБ данных в архивное хранилище. Один из вариантов, который мы рассматривали, - хранилище GPV2 со стандартной производительностью и доступом к архиву. У меня есть несколько вопросов о ценах. Я использовал калькулятор цен по адресу:

https://azure.microsoft.com/en-ca/pricing/calculator/

Данные, которые будут заархивированы, - это большие файлы изображений, а также контрактные документы. Из моего прочтения блочные капли, вероятно, будут оптимальными для архивирования. Это правильно?

В простом сценарии я хотел бы загрузить файл изображений размером 100 МБ. Мне нужно было бы иметь пустой блоб в контейнере и использовать набор BLOB-уровней, чтобы установить его как горячий или холодный. Затем я скопировал бы файл и снова использовал set blob tier, чтобы изменить его на архив. Как Azure обработает копию? Сколько блоков будет разбит файл? Я прочитал, что каждый путблок будет считаться одной транзакцией, а окончательный путблок будет считаться одной транзакцией. Сколько операций потребуется? Если цена составляет 100 центов за 100 000 операций, какую стоимость я могу оценить? Кроме того, какова будет стоимость изменения уровня с горячего или холодного на архивный?

Более дорогая задача - чтение данных. Через 180 дней клиент хочет прочитать данные. Большой двоичный объект в контейнере должен был бы быть установлен из архива в горячее или прохладное место, верно? Затем потребуется время для регидратации данных. Какая будет стоимость? Как будет обрабатываться файл при чтении данных и сколько операций get blob потребуется? Какие еще операции понадобятся. Глядя на ценовой сайт Azure, он говорит, что стоимость 100 000 операций составляет $ 55,00. Поскольку чтение должно быть намного дороже, я предполагаю, что будет большое количество операций.

Для организации контейнеров данных потребуется. Любая помощь в создании / удалении контейнера будет полезна.

1 Ответ

0 голосов
/ 19 марта 2020

Слишком много вопросов :). Позвольте мне попытаться ответить на них.

Насколько я понимаю, блочные капли, вероятно, будут оптимальными для архивирования. Это правильно?

Да. AFAIK, для уровня архива поддерживаются только блочные объекты.

В простом сценарии я хотел бы загрузить файл изображений размером 100 МБ. Мне нужно было бы иметь пустой блоб в контейнере и использовать набор BLOB-уровней, чтобы установить его как горячий или холодный. Затем я скопировал бы файл, а затем снова использовал set blob tier, чтобы изменить его на архив.

На самом деле вам не нужно этого делать. С Storage REST API version 2019-02-02 вы можете напрямую загружать BLOB-объекты в архив. Нет необходимости загружать их в горячий или классный уровень, а затем изменять уровень доступа на архив.

Сколько блоков будет разбит файл?

Это зависит. Maximum size of a block in a block blob can be 100 MB. По сути размер блока будет зависеть от вашей скорости Inte rnet. Я считаю, что в SDK используется размер блока 4 МБ.

Я прочитал, что каждый путблок будет считаться одной транзакцией, а окончательный список путблоков будет считаться одной транзакцией. Сколько операций потребуется?

Total operations required = number of blocks + 1 commit block list operation. Таким образом, если у вас есть блоб размером 100 МБ, и вы разбили его на блоки по 4 МБ, общее количество необходимых операций составит 25 (100 MB/4MB) + 1 = 26.

Если цена составляет 100 центов за 100 000 операций, какую стоимость я могу оценить?

В приведенном выше примере это будет $1.10 * 26 / 10000 = $0.000286 для одного большого двоичного объекта.

Кроме того, сколько будет стоить изменение уровня с горячего или холодного на архивный?

Пожалуйста, смотрите мой второй ответ. Вам действительно не нужно это делать.

Более дорогая задача - чтение данных. Через 180 дней клиент хочет прочитать данные. Большой двоичный объект в контейнере должен быть установлен из архива в горячее или холодное, верно?

Это верно.

Тогда потребуется время для регидратации данных. Какая будет стоимость? Как будет обрабатываться файл при чтении данных и сколько операций get blob потребуется? Какие еще операции понадобятся. Глядя на ценовой сайт Azure, он говорит, что стоимость 100 000 операций составляет $ 55,00. Поскольку чтение должно быть намного дороже, я предполагаю, что будет большое количество операций.

Вы можете найти эту информацию на странице Azure Storage Pricing. Ценообразование зависит от региона, в котором хранятся данные, поэтому оно в основном будет различным.

Для организации контейнеров данных потребуется. Любая помощь по стоимости создания / удаления контейнера будет полезна.

Опять же, вы можете найти эту информацию на странице цен хранения. Создание контейнера - это отдельная операция, и я считаю, что удаление контейнера - это бесплатная операция.

...