• База знаний
  • /
  • Блог
  • /
  • Wiki
  • /
  • ONLINE CHAT
+380 (44) 364 05 71

Статья также доступна на украинском (перейти к просмотру).

Количество сбоев в ЦОД уменьшилось

Содержание

Новый вектор технологического развития в мире: количество заметных сбоев в работе дата-центров в среднем за год уменьшается. Это положительный фактор, но есть и отрицательный: минута простоя оборудования теперь обойдется гораздо дороже, чем несколько лет назад. Интересно, что причины инцидентов остаются традиционными: это аварии электрооборудования, вентиляции и случаи, вызванные действиями персонала. Это результаты свежего исследования Annual Outage Analysis 2024 от Uptime Institute. Самое интересное из него – в анализе от специалистов хостинг-компании FREEhost.UA.

Дата-центров становится больше, отказов — меньше

Эксперты Uptime Institute дсследовали мировой рынок дата-центров и выявили тенденцию роста: по крайней мере, за последнее десятилетие. Современным фактором ускорения стал повышенный спрос на технологии AI/ML.

Так что в мире продолжают появляться новые дата-центры, а их площадь и мощность тоже растут. Уже никого не удивляют ЦОД на 100 МВт или даже больше. Однако у высокого спроса есть оборотная сторона: повышенная нагрузка. Несмотря на это, компании научились преодолевать риски и частота и тяжесть технологических сбоев снизились (если сравнивать с темпами роста мощностей). Другими словами, абсолютное количество аварий возросло (ведь дата-центров стало больше), однако их темпы ниже по сравнению с темпами наращивания технологических ресурсов. Поэтому количество отказов в расчете на 1 МВт уменьшается.

Почему? Ибо владельцы ЦОД — как государственные, так и частные — стали уделять больше внимания созданию резервных данных и обеспечению устойчивости к инфраструктурным вызовам (в частности, перебоям электроснабжения).

Однако это абсолютные данные, ведь исследователи из Uptime Institute отметили: информация об авариях относится к коммерческой тайне. Поэтому владельцы датацентров не всегда охотно делятся новостями об инцидентах и ??их последствиях. Так что общественность обычно знает о случаях, скрыть которые невозможно. Их среднее количество – до 20 в год.

Физическое резервирование сайтов

Отказы системы электропитания – самая распространенная причина

Исследователи сообщили, что за последние три года инциденты случались в ЦОД более 55% операторов. В прошлогоднем отчете этот показатель составил 60%, а в отчете за 2022 год – под 70%. Так что положительная тенденция очевидна. Однако 54% ??владельцев дата-центров сообщили, что стоимость одного сбоя обошлась им примерно в 100 тыс. долларов США, а 16% констатировали, что ущерб превысил 1 млн долларов.

При этом причины аварий те же. Наиболее распространен отказ системы электропитания, что в 52% повлекло нарушение в работе дата-центров. Исследователи предполагают, что причиной является тенденция перехода на возобновляемые источники энергии, что приводит к нарушению стабильности электрических сетей. Большинство случаев отключения регистрируют, когда дизельные генераторные установки и источники бесперебойного питания не успевают своевременно реагировать на сбои.

процент аварий в ЦОДах

ТТак, в 2023 году в ЦОДе Microsoft произошел масштабный сбой. Из-за проблем с электросетью дата-центр переключился на питание от генераторов, однако не все установки запустились вовремя. По этой причине сервисы Azure в Западной Европе какое-то время не работали.

На втором месте по частоте инцидентов – последствия выхода из строя охлаждающего оборудования. В 2023 году именно это привело к остановке 2,5 млн транзакций банков DBS и Citibank: в обслуживаемом их ЦОД Equinix произошел сбой системы охлаждения.

Проблемы с инженерными системами – очевидные причины. Однако есть и соприкасающиеся — это влияние «человеческого фактора». Из-за него обычно и случаются инциденты с оборудованием и сетями. Случайное или даже преднамеренное нарушение инструкций, регламентов и процедур в 75% влечет за собой малые и крупные аварии на ЦОД.

Именно поэтому исследователи советуют более тщательно выбирать персонал, инвестировать в его обучение и регулярно проверять квалификацию. В этом – «корень» уменьшения количества инцидентов с оборудованием.

Если вы ищете надежный дата-центр с несколькими уровнями резервного электроснабжения, высокоскоростным подключением к оптоволоконным магистралям, современными системами охлаждения, кондиционирования и пожаротушения, обратитесь в FREEhost.UA.

Подписывайтесь на наш телеграмм-канал https://t.me/freehostua, чтобы быть в курсе новых полезных материалов.

Смотрите наш канал Youtube на https://www.youtube.com/freehostua.

Мы в чем ошиблись, или что-то пропустили?

Напишите об этом в комментариях, мы с удовольствием ответим и обсуждаем Ваши замечания и предложения.

Дата: 28.08.2024
Автор: Сергей Носенко
Голосование

Авторам статьи важно Ваше мнение. Будем рады его обсудить с Вами:

comments powered by Disqus
navigate
go
exit
Спасибо, что выбираете FREEhost.UA