Статья также доступна на украинском (перейти к просмотру).
Содержание
- Дата-центров становится больше, отказов — меньше
- Отказы системы электропитания – самая распространенная причина
Новый вектор технологического развития в мире: количество заметных сбоев в работе дата-центров в среднем за год уменьшается. Это положительный фактор, но есть и отрицательный: минута простоя оборудования теперь обойдется гораздо дороже, чем несколько лет назад. Интересно, что причины инцидентов остаются традиционными: это аварии электрооборудования, вентиляции и случаи, вызванные действиями персонала. Это результаты свежего исследования Annual Outage Analysis 2024 от Uptime Institute. Самое интересное из него – в анализе от специалистов хостинг-компании FREEhost.UA.
Дата-центров становится больше, отказов — меньше
Эксперты Uptime Institute дсследовали мировой рынок дата-центров и выявили тенденцию роста: по крайней мере, за последнее десятилетие. Современным фактором ускорения стал повышенный спрос на технологии AI/ML.
Так что в мире продолжают появляться новые дата-центры, а их площадь и мощность тоже растут. Уже никого не удивляют ЦОД на 100 МВт или даже больше. Однако у высокого спроса есть оборотная сторона: повышенная нагрузка. Несмотря на это, компании научились преодолевать риски и частота и тяжесть технологических сбоев снизились (если сравнивать с темпами роста мощностей). Другими словами, абсолютное количество аварий возросло (ведь дата-центров стало больше), однако их темпы ниже по сравнению с темпами наращивания технологических ресурсов. Поэтому количество отказов в расчете на 1 МВт уменьшается.
Почему? Ибо владельцы ЦОД — как государственные, так и частные — стали уделять больше внимания созданию резервных данных и обеспечению устойчивости к инфраструктурным вызовам (в частности, перебоям электроснабжения).
Однако это абсолютные данные, ведь исследователи из Uptime Institute отметили: информация об авариях относится к коммерческой тайне. Поэтому владельцы датацентров не всегда охотно делятся новостями об инцидентах и ??их последствиях. Так что общественность обычно знает о случаях, скрыть которые невозможно. Их среднее количество – до 20 в год.
Отказы системы электропитания – самая распространенная причина
Исследователи сообщили, что за последние три года инциденты случались в ЦОД более 55% операторов. В прошлогоднем отчете этот показатель составил 60%, а в отчете за 2022 год – под 70%. Так что положительная тенденция очевидна. Однако 54% ??владельцев дата-центров сообщили, что стоимость одного сбоя обошлась им примерно в 100 тыс. долларов США, а 16% констатировали, что ущерб превысил 1 млн долларов.
При этом причины аварий те же. Наиболее распространен отказ системы электропитания, что в 52% повлекло нарушение в работе дата-центров. Исследователи предполагают, что причиной является тенденция перехода на возобновляемые источники энергии, что приводит к нарушению стабильности электрических сетей. Большинство случаев отключения регистрируют, когда дизельные генераторные установки и источники бесперебойного питания не успевают своевременно реагировать на сбои.
ТТак, в 2023 году в ЦОДе Microsoft произошел масштабный сбой. Из-за проблем с электросетью дата-центр переключился на питание от генераторов, однако не все установки запустились вовремя. По этой причине сервисы Azure в Западной Европе какое-то время не работали.
На втором месте по частоте инцидентов – последствия выхода из строя охлаждающего оборудования. В 2023 году именно это привело к остановке 2,5 млн транзакций банков DBS и Citibank: в обслуживаемом их ЦОД Equinix произошел сбой системы охлаждения.
Проблемы с инженерными системами – очевидные причины. Однако есть и соприкасающиеся — это влияние «человеческого фактора». Из-за него обычно и случаются инциденты с оборудованием и сетями. Случайное или даже преднамеренное нарушение инструкций, регламентов и процедур в 75% влечет за собой малые и крупные аварии на ЦОД.
Именно поэтому исследователи советуют более тщательно выбирать персонал, инвестировать в его обучение и регулярно проверять квалификацию. В этом – «корень» уменьшения количества инцидентов с оборудованием.
Если вы ищете надежный дата-центр с несколькими уровнями резервного электроснабжения, высокоскоростным подключением к оптоволоконным магистралям, современными системами охлаждения, кондиционирования и пожаротушения, обратитесь в FREEhost.UA.
Подписывайтесь на наш телеграмм-канал https://t.me/freehostua, чтобы быть в курсе новых полезных материалов.
Смотрите наш канал Youtube на https://www.youtube.com/freehostua.
Мы в чем ошиблись, или что-то пропустили?
Напишите об этом в комментариях, мы с удовольствием ответим и обсуждаем Ваши замечания и предложения.
Дата: 28.08.2024 Автор: Сергей Носенко
|
|
Авторам статьи важно Ваше мнение. Будем рады его обсудить с Вами:
comments powered by Disqus