slurmd не запускается - PullRequest
       88

slurmd не запускается

0 голосов
/ 19 марта 2020

Я хочу запустить вычислительный сервер на моем ноутбуке. Я пытаюсь запустить slurm, как указано в документации (https://slurm.schedmd.com/archive/slurm-18.08.5/quickstart_admin.html):

systemd (optional): enable the appropriate services on each system:
Controller: systemctl enable slurmctld
Database: systemctl enable slurmdbd
Compute Nodes: systemctl enable slurmd 

slurmctld и slurmdbd запущены:

● slurmctld.service - Slurm controller daemon
   Loaded: loaded (/lib/systemd/system/slurmctld.service; enabled; vendor preset: enabled)
   Active: active (running) since Thu 2020-03-19 18:51:54 +07; 12s ago
     Docs: man:slurmctld(8)
  Process: 23372 ExecStart=/usr/sbin/slurmctld $SLURMCTLD_OPTIONS (code=exited, status=0/SUCCESS)
 Main PID: 23374 (slurmctld)
    Tasks: 11
   Memory: 1.8M
   CGroup: /system.slice/slurmctld.service
           └─23374 /usr/sbin/slurmctld

● slurmdbd.service - Slurm DBD accounting daemon
   Loaded: loaded (/lib/systemd/system/slurmdbd.service; enabled; vendor preset: enabled)
   Active: active (running) since Thu 2020-03-19 18:52:28 +07; 10s ago
     Docs: man:slurmdbd(8)
  Process: 23409 ExecStart=/usr/sbin/slurmdbd $SLURMDBD_OPTIONS (code=exited, status=0/SUCCESS)
 Main PID: 23411 (slurmdbd)
    Tasks: 1
   Memory: 1.2M
   CGroup: /system.slice/slurmdbd.service
           └─23411 /usr/sbin/slurmdbd

Но slurmd выдает ошибка при запуске:

● slurmd.service - Slurm node daemon
   Loaded: loaded (/lib/systemd/system/slurmd.service; enabled; vendor preset: enabled)
   Active: failed (Result: exit-code) since Thu 2020-03-19 18:52:56 +07; 1s ago
     Docs: man:slurmd(8)
  Process: 23428 ExecStart=/usr/sbin/slurmd $SLURMD_OPTIONS (code=exited, status=1/FAILURE)

Мне также интересно, почему slurmctld показывает, что запущено 11 задач:

Tasks: 11

Может быть, вы можете помочь мне помочь, но NODELIST(REASON) имеет значение (Nodes required for job are DOWN, DRAINED or reserved for jobs in higher priority partitions).

...