Apache Ray Автоматическая настройка кластера для частного кластера - PullRequest
0 голосов
/ 28 февраля 2020

Я успешно настроил мини-кластер Ray (1 руководитель + 1 рабочий, каждый с 4 ядрами процессора) вручную. Однако я не смог настроить его автоматически с помощью Apache Ray autoscaler. Головной узел запускается правильно, а рабочий узел никогда не присоединяется к кластеру. Ниже моя конфигурация YAML для автомасштабера. Что-то я не так сделал?

cluster_name: my_ray_cluster

min_workers: 8
initial_workers: 8
max_workers: 8

provider:
    type: local
    head_ip: 10.148.186.178
    worker_ips: [10.148.186.18]

auth:
    ssh_user: USER_NAME
    ssh_private_key: ~/.ssh/id_rsa

# Files or directories to copy to the head and worker nodes. 
file_mounts: {
#    "/path1/on/remote/machine": "/path1/on/local/machine",
#    "/path2/on/remote/machine": "/path2/on/local/machine",
}

head_setup_commands: 
    - pip3 install ray[debug,dashboard]
setup_commands:
    - pip3 install ray[debug,dashboard]

# Command to start ray on the head node. You don't need to change this.
head_start_ray_commands:
    - ray stop
    - ray start --head --redis-port=6379

worker_start_ray_commands:
    - ray stop
    - ray start --address=10.148.186.178:6379
...