Где находится докершим и связанные с ним логи для отладки kubeflow / pipeline / helloworld - PullRequest
0 голосов
/ 22 апреля 2020

Я пытаюсь запустить образцы kubeflow (pipelines / pytorchjob et c), но он складывается как ContainerCreating.

Для этой цели я хочу увидеть dockershim и docker журналы. Есть ли какая-либо документация?

образец кода следует https://github.com/kubeflow/pipelines/tree/master/samples/core/helloworld

kubectl create serviceaccount pipeline-runner
python3 hello_world.py
kubectl create -f hello_world.py.yaml
$ kubectl describe workflow.argoproj.io/my-first-pipeline-wgkg2
Name:         my-first-pipeline-wgkg2
Namespace:    default
Labels:       workflows.argoproj.io/phase=Running
Annotations:  pipelines.kubeflow.org/pipeline_spec: {"description": "A hello world pipeline.", "name": "My first pipeline"}
API Version:  argoproj.io/v1alpha1
Kind:         Workflow
Metadata:
  Creation Timestamp:  2020-04-22T00:11:41Z
  Generate Name:       my-first-pipeline-
  Generation:          3
  Resource Version:    23748
  Self Link:           /apis/argoproj.io/v1alpha1/namespaces/default/workflows/my-first-pipeline-wgkg2
  UID:                 50acafe4-2254-4dea-865d-7ec03496e523
Spec:
  Arguments:
  Entrypoint:            my-first-pipeline
  Service Account Name:  pipeline-runner
  Templates:
    Container:
      Args:
        echo "hello world"
      Command:
        sh
        -c
      Image:  library/bash:4.4.23
      Name:
      Resources:
    Inputs:
    Metadata:
    Name:  echo
    Outputs:
    Dag:
      Tasks:
        Arguments:
        Name:      echo
        Template:  echo
    Inputs:
    Metadata:
    Name:  my-first-pipeline
    Outputs:
Status:
  Finished At:  <nil>
  Nodes:
    my-first-pipeline-wgkg2:
      Children:
        my-first-pipeline-wgkg2-3423630397
      Display Name:   my-first-pipeline-wgkg2
      Finished At:    <nil>
      Id:             my-first-pipeline-wgkg2
      Name:           my-first-pipeline-wgkg2
      Phase:          Running
      Started At:     2020-04-22T00:11:41Z
      Template Name:  my-first-pipeline
      Type:           DAG
    my-first-pipeline-wgkg2-3423630397:
      Boundary ID:    my-first-pipeline-wgkg2
      Display Name:   echo
      Finished At:    <nil>
      Id:             my-first-pipeline-wgkg2-3423630397
      Message:        ContainerCreating
      Name:           my-first-pipeline-wgkg2.echo
      Phase:          Pending
      Started At:     2020-04-22T00:11:41Z
      Template Name:  echo
      Type:           Pod
  Phase:              Running
  Started At:         2020-04-22T00:11:41Z
Events:               <none>

kubectl logs следует

$ kubectl logs my-first-pipeline-wgkg2-3423630397 -c wait
Error from server (BadRequest): container "wait" in pod "my-first-pipeline-wgkg2-3423630397" is waiting to start: ContainerCreating
$ kubectl logs my-first-pipeline-wgkg2-3423630397 -c main
Error from server (BadRequest): container "main" in pod "my-first-pipeline-wgkg2-3423630397" is waiting to start: ContainerCreating

1 Ответ

1 голос
/ 22 апреля 2020

После того, как вы окажетесь в рабочих узлах, вы можете сделать docker ps, чтобы узнать containerid для контейнера, а затем просмотреть журналы. docker logs containerid команда может быть полезна.

Также посмотрите журналы кубелетов в рабочие узлы, чтобы узнать, есть ли какая-либо проблема, запустив команду journalctl -u kubelet.service -f на рабочих узлах.

...