Устранение неполадок отказоустойчивого кластера в W2K8 / SQL05 - PullRequest
0 голосов
/ 20 января 2010

У меня есть активная / пассивная пара кластеров W2K8 (64), работающая под управлением SQL05 Standard. Общее хранилище находится в HP EVA SAN (FC).

Недавно я расширил файловую систему на активном узле для базы данных, добавив обозначение диска. Диски с общим хранилищем обозначаются как F :, I :, J :, L: и X :, при этом файловые системы SQL на первых 4 и X: используются для назначения резервной копии.

Прошлой ночью, в рамках процесса проверки (пассивный узел был отключен для обслуживания), я переместил экземпляр SQL на другой узел кластера. Рассматриваемая база данных немедленно перешла в статус «Подозреваемый».

Просмотр системных журналов показал, что база данных не будет загружаться, поскольку файл "K: \ SQLDATA \ what.ndf" не найден. (Обратите внимание, что у нас нет a K: обозначение диска.)

В обзоре накопителя J: показано ноль содержимого - ничего - именно там и должен был находиться файл "what.ndf".

Хм, подумал я. Проблема с сервером. Я просто перенесу SQL обратно на другой сервер и выясню, что не так ..

Все еще нет базы данных. Подозреваемый. Ой-ой. «Что бы ни случилось» вошло в ведро с битами.

Я наконец решил просто восстановить из резервной копии (которая была сделана непосредственно перед проверочным тестом), так что ничего не было потеряно, кроме нескольких часов сна.

Вопрос: (1) Почему пассивный узел думал, что файлы what.ndf должны были идти на диск «K:», когда этот диск не существовал как ресурс на активном узле

(2) Как я могу получить повторную синхронизацию узлов кластера, чтобы можно было выполнить отработку отказа?

Я не знаю, что в прошлом не было диска "K:" в качестве ресурса кластера, но я знаю, что этот диск не существовал в исходном кластере во время перемещения ресурса.

1 Ответ

0 голосов
/ 20 января 2010

Случайная мысль, основанная на том, что случилось со мной несколько месяцев назад ... звучит очень похоже

У вас есть точки монтирования NFTS? Я забыл, что это было именно (я был обезьяной и полагался на администраторов баз данных), но точки монтирования были либо «дважды зарезервированы», либо не являлись частью ресурса кластера, либо тома SAN были настроены неправильно.

У нас были диски нулевого размера (я использовал xp_fixeddrives) для файлов журналов, но мы все равно могли записывать в них.

Разные перезагрузки и отработки отказа не увенчались успехом. По сути, это был тщательный анализ всех настроек в инструменте управления SAN.

Возможность для вашего K: drive ...

Другая вещь, которую я видел, это то, что на смонтированных дисках есть буквы, а также они монтируются в папки. Раньше я использовал подключенные папки для SQL Server, но в системе резервного копирования использовалась прямая буква диска.

...