Docker Контейнер nvidia / k8s-device-plugin: 1.9 Сохраняет сообщение об ошибке - PullRequest
0 голосов
/ 09 февраля 2020

Я пытаюсь настроить один небольшой кластер kubenertes на моем сервере Ubuntu 18.04 LTS. Теперь каждый шаг сделан, но проверка состояния графического процессора завершается неудачно. Контейнер хранит сообщения об ошибках:

1. Описание проблемы
Я сделал шаги по Быстрый запуск , но когда я запускаю тестовый пример, он сообщает об ошибке.

2. Действия по воспроизведению проблемы

  • exe c shell cmd

    docker run --security-opt = no-new-привилегии --cap-drop = ALL --network = нет -it -v / var / lib / kubelet / плагины устройств: / var / lib / kubelet / плагины устройств nvidia / k8s-device-plugin: 1.9

  • проверьте ошибки

    2020/02/09 00:20:15 Начало работы на / var / lib / kubelet / device-plugins / nvidia. sock
    2020/02/09 00:20:15 Не удалось зарегистрировать плагин устройства: rp c ошибка: код = невыполненный дес c = неизвестный сервисныйplugin_plugin.Registration
    2020/02/09 00:20 : 15 Не удалось связаться с Кубелетом, повторная попытка. Включили ли вы функцию Gateway с функцией плагина устройства?
    2020/02/09 00:20:15 Предварительные условия можно проверить по адресу: https://github.com/NVIDIA/k8s-device-plugin#prerequisites
    2020/02/09 00:20: 15 Вы можете узнать, как установить время выполнения: https://github.com/NVIDIA/k8s-device-plugin#quick -start

3. Информация об окружающей среде
- выходы nvidia- docker run --rm dlws / cuda nvidia-smi

NVIDIA-SMI 440.48.02 Версия драйвера: 440.48.02 Версия CUDA: 10.2

  • выходы nvidia- docker run - rm dlws / cuda nvidia-smi

NVIDIA-SMI 440.48.02 Версия драйвера: 440.48.02 Версия CUDA: 10.2

  • содержимое / etc / docker / daemon. json

содержимое:

{
"default-runtime": "nvidia",
"runtimes": {
    "nvidia": {
        "path": "nvidia-container-runtime",
        "runtimeArgs": []
    }
}

}

  • docker версия: 19.03.2
  • версия kubernetes: 1.15.2

1 Ответ

0 голосов
/ 24 февраля 2020

Наконец-то я нашел ответ, надеюсь, этот пост будет полезен для тех, кто сталкивается с такой же проблемой:

Для kubernetes 1.15 используйте k8s-device-plugin: 1.11 вместо . Версия 1.9 не умеет общаться с кубелетом.

...