Поддержание связи между приложениями и инфраструктурой - PullRequest
2 голосов
/ 11 марта 2009

Я работаю в ИТ-отделе, который разделен на две группы. Одна группа разрабатывает и управляет приложениями, другая управляет инфраструктурой и серверами компании. Одна из проблем, с которыми мы сталкиваемся, - это нарушение коммуникации. Я работаю в группе приложений, и одной из проблем, с которыми я сталкиваюсь, не является уведомление о том, что сервер отключается инфраструктурой или обновляется база данных.

Есть ли у кого-нибудь предложения о том, как улучшить связь между двумя группами, или какие-либо идеи о том, как вести легкий журнал в нескольких системах (как в Linux, так и в Windows)? В идеале было бы неплохо, если бы наши боксы просто сообщали о своих статусах или что-то в этом роде.

Спасибо за помощь,

Ben

Ответы [ 4 ]

2 голосов
/ 11 марта 2009

Единственное, что вы можете сделать, чтобы сообщить о состоянии сервера, - это настроить нашу группу инфраструктуры на настройку системы мониторинга сети, например Nagios . Это даст всем в вашей группе приложений возможность получить снимок состояния каждого сервера в системе. Наличие такого рода статуса неоценимо, когда вы занимаетесь разработкой.

Nagios обеспечивает мониторинг сети, но также позволяет показывать запланированное время простоя для определенного сервера в системе.

Еще одна вещь, которую ваша группа может сделать для улучшения взаимодействия с инфраструктурой, - это предоставить вашей системе сборки отчет о том, какие серверы она в настоящее время использует для сборки и тестирования ваших продуктов.

Кроме того, организация регулярных встреч между заинтересованными сторонами обеих групп, вероятно, также является хорошей идеей. Если вы все разговариваете друг с другом, даже в течение 15 минут в неделю, вы, вероятно, увидите, что инциденты, подобные описанному выше, значительно падают.

1 голос
/ 11 марта 2009

Я думаю, что это большая проблема контроля изменений.

У вас должен быть контроль над изменениями аппаратного и программного обеспечения и процесс утверждения.

В конечном счете, инфраструктура служит вам - целью ИТ-инфраструктуры является запуск приложений.

В моей нынешней крупной компании, занимающейся финансовыми данными, серверы НЕ ПРИКАСАЮТСЯ без надлежащей авторизации через группы клиентов и приложений. Это кажется огромной болью, но у каждого отдельного сервера есть причина - для достижения конкретной бизнес-цели и запуска конкретного приложения. У группы инфраструктуры просто нет оправдания тому, чтобы по собственному желанию что-то менять или расстраивать серверы.

Реакция на критический сбой оборудования может быть исключением.

Необходимые обновления программного обеспечения и ОС обрабатываются через окна планового обслуживания и утвержденный процесс изменений.

0 голосов
/ 11 марта 2009

Внедрение процесса управления изменениями, когда изменения представляются, утверждаются и планируются для групп ОБА . Это позволяет всем знать, что происходит. Этот процесс может быть легким или тяжелым, как вы хотите.

0 голосов
/ 11 марта 2009

Мне также нравится идея Nagios. Если вы хотите настроить что-то большее, чем средство коммуникации, я бы порекомендовал систему управления контентом, такую ​​как Drupal.

Мы используем Drupal для общения между командами. Когда одна команда отключает сервер, они добавляют событие в Drupal. Остальные из нас либо получат его по электронной почте, в формате RSS, либо просто обновят страницу.

...