У меня есть один (EC2) сервер Ubuntu, на котором bluepill
прекрасно работает для запуска и мониторинга resque
процессов (и он делал это на других узлах в прошлом).
Я настраиваю новый узел, и по какой-то причине на этом узле bluepill
не распознает, что процессы запущены и работают, и поэтому продолжает создавать новые. Я немного сбит с толку тем, что вызывает это. 2 узла практически идентичны; они оба сервера EC2, обеспеченные теми же самыми chef
сценариями. Это правда, что один не работает - это «производство», а другой «постановка», но разницы почти нет из-за этого.
Есть какие-нибудь мысли или предложения, прежде чем я раскошелюсь с github-проектом и начну добавлять больше мониторинга, чтобы попытаться выяснить, что происходит? В прошлом в этом списке обсуждалась проблема с / 1009 * и resque
, но, как я уже сказал, это нормально работает на моем промежуточном сервере и хорошо работает на более ранних производственных серверах (хотя я отмечу, что это новое рабочий сервер - ruby 1.9.3 (против 1.9.2) и rails 3.2 (против 3.1)).
Вот мой файл .pill
(или, точнее, файл шаблона моей поваренной книги chef
):
ENV["RAILS_ENV"] = "<%= node.chef_environment %>"
ENV["QUEUE"] = "*"
Bluepill.application("zmx_app") do |app|
app.working_dir = "/srv/zmx/current"
app.uid = "root"
app.gid = "root"
2.times do |i|
app.process("resque-#{i}") do |process|
process.group = "resque"
process.start_command = "rake resque:work"
process.pid_file = "/srv/zmx/current/tmp/pids/resque_workers-#{i}.pid"
process.stop_command = "kill -QUIT {{PID}}"
process.daemonize = true
end
end
end