Dumb ways to die, или 7 популярных ошибок при подключении оборудования
Не хотелось бы никого расстраивать, но даже самый “нарядный” ЦОД - с резервированием по схеме N в кубе и вообще ваш собственный - еще не гарантия бесперебойной работы оборудования: это самое оборудование, прежде всего, нужно правильно подключить.
“Спасибо, Кэп!” - снисходительно улыбнется мой читатель, а я ему отвечу: не стоит благодарностей, сходите лучше в ЦОД и проверьте еще раз ваши стойки. Да-да, те самые, с которыми сто лет как все в порядке. Вы не поверите, как часто именно с такими вот “беспроблемными” стойками и случается прискорбное. Я даже чеклист набросал.
Итак, что НЕ должно встретиться вам на этой послеобеденной прогулке:
1. Сервер, СХД или сетевое оборудование о двух блоках питания, подключенных зачем-то к одному PDU*.
Вот вроде бы азбука, - а вы все же проверьте. Бывает.
Вариация на ту же тему - АВР, обоими кабелями питания воткнутый в один и тот же PDU.
Во избежание: АВР (автоматический ввод резерва) - это такая штуковина, посредством которой к двум PDU (и, стало быть, к двум лучам) подключается оборудование с одним блоком питания - например, сетевое: коммутаторы, маршрутизаторы, вот это все.
Предположим, по чьей-то рассеянности АВР, к которому вот это все подключено, оказывается запитан от одного PDU. Чем это чревато? При пропадании соответствующего луча оборудование с таким АВР, разумеется, отключится, - а если это сетевое железо, вы и вовсе потеряете связь со всей стойкой. Звучит не очень, согласитесь.
2. Оборудование с одним блоком питания, подключенное вовсе без АВР.
Плохая, плохая идея. Понимаю, копейка рубль бережет, - но вам ведь важно, чтобы оно еще и безотказно работало, верно?
3. Загрузка АВР более чем на 75-80%.
В чем тут засада: при запуске и перезагрузке оборудование потребляет гораздо больше тока, чем в обычном рабочем режиме. Соответственно, если «запаса» АВР на такие разовые «всплески» нет, у вас при запуске перезапуске просто «выбьет пробки» и привет.
4. Оборудование, подключенное в соседние стойки.
Возможно, кому-то покажется остроумным “отгрузить” немного электропотребления в соседний “шкаф”, раз уж он простаивает недоутилизированным, пока рядом, что называется, некуда вешать. А теперь вопрос на засыпку: что там у нас к какому лучу подключено в итоге? А? Никто не в курсе? Вот то-то и оно.
Еще есть такой нюанс, как тепло, вырабатываемое оборудованием, и риски локального перегрева стойки, нагруженной этим оборудованием «под завязку». Перегрев и бардак с прокладкой проводов - не лучшее подспорье в ИТ-хозяйстве, поверьте.
5. Перегруженные секции PDU.
Начну издалека: у PDU есть секции, и это все не просто так. Каждая секция стандартного PDU, суммарная мощность которого составляет, скажем, 32А, рассчитана на ток не более 16А. А на 20А уже не рассчитана. И на 25 тоже нет. Даже если вторая секция совершенно свободна. Такой вот нюанс.
А теперь представим, что кто-то (с самыми светлыми, заметим мы в скобках, намерениями) аккуратно заполняет стойку оборудованием и АВР - допустим, снизу вверх - и, понятно, подключает все это дело также строго снизу вверх. Чтобы как раз без бардака и красиво.
Казалось бы, все правильно сделал, и 32А еще не вычерпаны, а всего только 20 - живи да радуйся. Потом одним прекрасным утром в ЦОДе отключается один луч питания - и внезапно (!) на “перегретой” секции срабатывают защитные автоматы и вся эта секция (с подключенным к ней оборудованием, да-да) благополучно отключается. Изящно, правда? Хотите себе такое?
6. Стойка, перегруженная оборудованием настолько, что вынуждена в штатном режиме “кормиться” сразу от двух лучей, один из которых вообще-то резервный.
Тут такое дело: резерв, который задействован в штатной ситуации, - он как бы уже и не резерв, что ли...
Хорошая же новость заключается в том, что есть и человеческие способы увеличить мощность стойки,- причем без отключения активного оборудования. Заинтриговал? Тогда записывайте:
- во-первых, можно добавить еще пару PDU аналогичной мощности и все новое оборудование...ладно, дальше сами, не маленькие;
- во-вторых (вариант поэкзотичнее), можно заменить текущие PDU на более мощные
Здесь, пожалуй, потребуется некоторая сноровка, но в целом все, опять-таки, прозрачно: ставите более мощные автоматы, прокладываете более мощный кабель, устанавливаете новый (по совместительству более мощный) PDU рядом с прежним - и спокойно переключаете оборудование из одного PDU в другой. Ну, то есть как спокойно: если вдруг у вас недосмотр по пункту один нашего чеклиста, может получиться неловко. А если все четко - пройдет без помех. Далее повторяете процедуру со вторым PDU - и виват! Можно пойти перекурить.
7. Вы только не смейтесь, но… проверьте индикацию. Нет, правда, проверьте.
У самого бывало: подключили АВР, вроде бы все ok, – а плохой контакт, или нерабочий провод, или вовсе неплотно вставлен кабель… продолжать?
То же самое и с двумя блоками питания: внешне все прекрасно – оборудование работает, проблем нет. А на самом деле один из блоков давно помер, не оставив завещания.
В общем, не ленитесь раз в как получится проверить особенно дорогое вашему сердцу оборудование на наличие красных лампочек или отсутствие зеленых в нужных местах. Сами себе потом спасибо скажете.
На этом наш скромный хит-парад несуразностей при подключении оборудования исчерпан. Непрерывного вам сервиса и бесперебойных благ.
Кирилл Шадский, DataLine, начальник отдела эксплуатации ЦОД
|