Sagemaker модель CloudFormation удаление стека - PullRequest
0 голосов
/ 20 сентября 2018

Я пытаюсь развернуть «AWS :: SageMaker :: Model», которая развернута в VPC, и она работает нормально, но когда я удаляю ее, я получаю удаляемую модель успешно, но когда она пытается удалить группу безопасностисвязанный с ним, он не может сказать «DependencyViolation».

Расследование обнаружило, что объект Model удален, но все еще остается ENI, к которому присоединена группа безопасности.

Вывод стекавыглядит следующим образом:

stack_puts

Роль IAM, связанная с моделью, имеет следующую управляемую политику: "arn: aws: iam :: aws: policy /AmazonSageMakerFullAccess ".

Я знаю, что это ранее случалось с Lambda, когда он мог работать внутри VPC, и это было исправлено. Интересно, возникает ли у нас такая же проблема с Model.

Также стоит отметить, чтообратите внимание, что это не происходит "AWS :: SageMaker :: NotebookInstance".

Мое определение модели выглядит следующим образом:

  TESTMODEL:
    Type: "AWS::SageMaker::Model"
    Properties:
      ExecutionRoleArn: !GetAtt ExecutionRole.Arn
      PrimaryContainer:
        Image: "514117268639.dkr.ecr.ap-southeast-2.amazonaws.com/forecasting-deepar:1"
        ModelDataUrl: "s3://test-sagemaker/sagemaker/DEMO-deepar/output/DEMO-deepar-2018-09-03-02-18-02-278/output/model.tar.gz"
      ModelName: "Test"
      VpcConfig:
        Subnets:
          - subnet-457ee522
          - subnet-c0b82c89
          - subnet-2cc22074
        SecurityGroupIds:
          - !GetAtt SageMakerModelSG.GroupId

  SageMakerModelSG:
    Type: "AWS::EC2::SecurityGroup"
    Properties:
      GroupDescription: "SageMakerModelSG"
      VpcId: vpc-4df92b2a
      Tags:
        - Key: "Name"
          Value: !Join [ -, [ !Ref "AWS::StackName", "SageMakerModelSG" ] ]

  SageMakerModelSGIngresshttps:
    Type: "AWS::EC2::SecurityGroupIngress"
    Properties:
      GroupId: !Ref SageMakerModelSG
      Description: "https"
      IpProtocol: "tcp"
      FromPort: "443"
      ToPort: "443"
      CidrIp: "0.0.0.0/0"

Ответы [ 2 ]

0 голосов
/ 11 октября 2018

Я позвонил в службу поддержки AWS, и в результате возникла ситуация, что сетевой интерфейс требует некоторого времени для удаления, и поэтому стек не сможет разрушиться, как я планировал.

Исправление,либо вручную создать группу безопасности, либо создать группу безопасности в другом стеке.Следовательно, модель sagemaker будет разрушена, и сетевые интерфейсы будут удалены позже.

Я обновил свои тесты CI, чтобы отразить это, и это работает.

0 голосов
/ 25 сентября 2018

Вы пытались снова удалить стек CloudFormation?Могут быть задержки в отсоединении ENI от VPC, поэтому повторная попытка может помочь здесь.

Если проблема не исчезнет, ​​я бы посоветовал вам создать случай поддержки клиентов или сообщение на форуме AWS со следующей информацией, поэтому SageMakerКоманда может расследовать вашу проблему и предоставить информацию.

  • Идентификатор учетной записи
  • Регион (где вы создавали ресурсы SageMaker)
  • Конечная точка / Конечная точкаConfig / Имена моделей
  • Идентификаторы VPC и подсети
...