Использование ИИ при охлаждении серверов в ЦОД: прошлое, настоящее и будущее
20 апреля 2021 г. | Категория: Мир
Управление температурным режимом серверного оборудования в ЦОД становится одним из наиболее многообещающих способов применения искусственного интеллекта (ИИ). Данная технология уже используется в северных фермах, помогая управлять сетевой инфраструктурой и защищать ее, балансируя и перемещая рабочие нагрузки.
Однако отраслевые игроки не спешат применять ИИ к вспомогательной инфраструктуре в целом, и, в частности, к инфраструктуре охлаждения серверов. А ведь на долю последней приходится около трети общего энергопотребления типичной серверной фермы.
Первая ласточка от Google и DeepMind
Постоянные читатели портала TelecomBloger, вероятно, помнят историю без малого пятилетней давности о том, как инженеры Google решили использовать механизм генерации рекомендаций на основе глубокого машинного обучения, разработанный DeepMind, для «последовательного» снижения количества электроэнергии, используемой при охлаждении серверов в одном из дата-центров поискового гиганта.
В рамках первоначального пилотного проекта данный подход позволил сократить энергопотребление системы охлаждения на 40 процентов. В 2018 компания пошла еще дальше и позволила алгоритмам вносить корректировки автоматически. Да, система оставалась под контролем человека, но операторы ЦОД играли скорее роль наблюдателей.
Учитывая озабоченность отрасли касаемо выбросов парниковых газов, попадающих в атмосферу при эксплуатации ЦОД, и растущий энтузиазм по поводу внедрения ИИ в различных областях, хочется надеяться, что подобные разработки получат более широкое распространение в сегменте дата-центров.
К сожалению, создание систем подобного плана требует сочетания глубоких технических знаний в области принципов функционирования вспомогательной инфраструктуры дата-центров и передовых исследований в области машинного обучения.
Медленный старт
Позволить себе наем соответствующих специалистов и огромные инвестиции в разработки способны лишь мега-корпорации. Упомянутый выше стартап DeepMind, купленный ранее Google, — исследовательская команда с практически неограниченным бюджетом и без коммерческих продуктов.
Поскольку дата-центры являются основой бизнеса Google, компания, не желающая давать конкурентам ценные преимущества, вряд ли поделится разработками с отраслью. Остается надеяться на независимых поставщиков программного обеспечения для дата-центров.
Последние недавно начали активно внедрять машинное обучение в области управления пустующим пространством внутри машзалов. Процесс шел медленно. Мешало общее недоверие к технологии искусственного интеллекта.
Достигшие определенных успехов вендоры взялись за охлаждение. В течение последних лет стали появляться многообещающие тематические исследования как за пределами Google, так и внутри компании.
Первые результаты и изобилие исходных данных
Принимавшие участие в данных исследовательских проектах операторы дата-центров сообщают: ИИ действительно сокращает количество электроэнергии, расходуемой на охлаждение серверов, минимизируя счета за электричество и углеродный след бизнеса.
Управление охлаждающим оборудованием в режиме реального времени представляет собой подходящую задачу для моделей машинного обучения, поскольку последние позволяют генерировать решения и рекомендации, учитывая гораздо больше данных, чем человек или команда операторов ЦОД. Причем ИИ может предлагать решения, способные показаться нетрадиционными и даже противоречащими интуиции.
Дополнительный плюс заключается в наличии большого количества исходных данных, доступных для загрузки в системы ИИ. В отличие от некоторых иных промышленных сред, дата-центры уже «нафаршированы» датчиками. И операторы ЦОД способны при необходимости достаточно оперативно и легко добавить новые сенсоры.
Исследования и разработки Siemens
В конце 2020 немецкий промышленный гигант Siemens опубликовал технический документ, освещая некоторые преимущества систем на основе искусственного интеллекта, используемых для оптимизации инфраструктуры охлаждения серверного оборудования.
В документе говорится, что машинное обучение позволяет регулировать производительность инфраструктуры охлаждения в режиме реального времени, чтобы согласовывать потребности в охлаждении помещений с мощностью охладительного оборудования при периодическом изменении IT-нагрузки.
Это достойная цель, поскольку напрямую сокращается потребление электроэнергии, избегая проблемы переохлаждения, которая широко распространена в современных дата-центрах. Операторы ЦОД любят проявлять осторожность.
Использование ИИ для оптимизации охлаждения серверов дополнительно сводит к минимуму потребность в надзоре со стороны персонала на объекте, позволяя эффективно оптимизировать человеческие ресурсы и использовать освободившихся сотрудников для выполнения иных критически важных задач. Дополнительный плюс – сокращение количества поездок людей между дата-центрами, что крайне важно в условиях пандемии, когда доступ к отдельным объектам ограничен из-за локдаунов.
Собственный подход Siemens к применению искусственного интеллекта для оптимизации инфраструктуры охлаждения серверов сочетает два продукта:
- Demand Flow (фокусируется на мониторинге и контроле подачи охлажденной воды);
- WSCO (или White Space Cooling Optimization — платформа, собирающая и анализирующая данные с датчиков температуры / подачи воздуха, вырабатывая рекомендации, необходимые для регулировки воздушных потоков для поддержания корректной температуры в отдельных частях машзала .
В декабре 2020 данные продукты в составе единой платформы были развернуты для контроля инфраструктуры охлаждения в первом дата-центре с сертификатом Tier IV в Париже, построенном по заказу французского банка Caisse des Dépôts. Предполагается, что ЦОД сможет выйти на коэффициент полезного использования энергии (PUE) на уровне 1,2 единицы.
Решение от Vigilent
Инструмент WSCO разработан Siemens в партнерстве с компанией Vigilent (ранее Federspiel Controls). Речь о крошечной фирме из Окленда, специализирующейся на охлаждении критически важной инфраструктуры.
Софтверная компания Vigilent разработала (и запатентовала) систему динамического управления охлаждением серверов в ЦОД, основанную на контролируемом машинном обучении. Продукт обладает способностью управлять вспомогательным оборудованием ЦОД, точно так же, как система, разработанная DeepMind.
Программное обеспечение учится, непрерывно анализируя данные с датчиков на предмет изменений состояния окружающей среды, основывая генерируемые рекомендации на статистических данных. Система способна оценить полезность любого отдельного блока кондиционирования воздуха для машзала (CRAH) внутри здания и определить блоки, которые тратят ресурсы впустую.
Разработчики Vigilent обещают возможность добиться экономии электроэнергии на уровне, аналогичном тому, который удалось продемонстрировать в эксперименте Google. Согласно утверждениям девелоперов, основанных на результатах анализа более чем 5 сотен охлаждающих установок, количество электроэнергии, затрачиваемой на охлаждение, уменьшается в среднем на 38%.
Компания лицензирует технологии машинного обучения не только Siemens, но и множеству поставщиков программного обеспечения из категории DCIM и BMS, включая ABB, Hitachi Vantara, и Schneider Electric.
Китайский конгломерат Huawei присоединяется к «гонке вооружений»
Еще один лидер в области использования искусственного интеллекта для автоматизированного управления охлаждением — китайский конгломерат Huawei. В 2020 компания запустила облачный сервис iCooling, использующий глубокое машинное обучение для обработки данных с датчиков, определения взаимосвязей между параметрами различных компонентов оборудования и систем, а также согласования производительности помп, чиллеров и градирен с IT-нагрузкой.
Согласно заявлениям представителей китайской компании, данный сервис повысил эффективность энергопотребления (PUE) на восемь процентов при развертывании в одном из собственных облачных дата-центров Huawei.
Когда телекоммуникационный гигант China Mobile опробовал iCooling, инженерам удалось добиться снижения на 3,2 процента общего энергопотребления дата-центра в Чжунвэе. Годовая экономия электроэнергии в данном случае способна составить более 400 000 кВт*ч. Ожидается, что система обеспечит еще большую экономию электроэнергии, поскольку она продолжает учиться, анализируя агрегируемые данных с датчиков внутри ЦОД.
Выводы экспертов Capgemini Research
Дискуссии касательно применения искусственного интеллекта для охлаждения дата-центров сопряжены с более масштабными дебатами об использовании ИИ для обеспечения экологической устойчивости индустрии ЦОД в целом.
Авторы тематического отчета, опубликованного недавно консалтинговой компанией Capgemini Research, пришли к следующему выводу: инновационные приложения на основе искусственного интеллекта способны сократить глобальные выбросы парниковых газов на 16 процентов в течение следующих трех-пяти лет.
Аналитики Capgemini определили ряд положительных примеров использования ИИ, отметив, что платформы и алгоритмы оптимизации энергопотребления, заточенные под выявление дефектов и прогнозирование отказов оборудования без прерывания бизнес-процессов, относятся к числу наиболее ценных и перспективных. Теги: Google, DeepMind, Siemens, Vigilent, Huawei, Capgemini Research
|