Статья также доступна на украинском (перейти к просмотру).

Содержание:
- Что такое RAID и зачем он нужен
- Базовые принципы работы
- Основные уровни RAID
- Сравнительная таблица
- RAID ≠ Backup
- Какой RAID выбрать
- Software vs Hardware RAID
- Практика / Реальный опыт
- Практическое решение от FREEhost.UA
Обеспечение сохранности данных на сервере является одним из ключевых приоритетов для любого проекта. Для этого используется ряд стратегий, основные из которых — RAID-массивы и системы резервного копирования (backup). Каждый из подходов имеет свои особенности применения и назначение. Рассмотрим их подробнее, чтобы проще было выбрать оптимальный способ защиты данных для своего проекта.
Что такое RAID и зачем он нужен
RAID (Redundant Array of Independent Disks) — это технология, позволяющая повысить надежность дисковой системы и улучшить доступность данных за счёт избыточности и способа их организации. Физически это реализуется с помощью набора HDD или SSD дисков, объединённых в один логический диск.
Конфигурация RAID может отличаться в зависимости от выбранного уровня (0, 1, 4, 5, 6, 10), который определяет схему организации данных. Соответственно, уровень избыточности, производительность и емкость системы будут различаться.
Использование RAID не гарантирует сохранность данных в критической ситуации, а лишь повышает отказоустойчивость дисковой подсистемы, например при сбоях. Все остальные «катастрофы» — случайное удаление файлов, вирус, целенаправленная атака — могут привести к безвозвратной потере информации. RAID не защищает данные на уровне тома, поэтому его наличие не отменяет необходимость регулярных резервных копий.
Базовые принципы работы
Все конфигурации RAID строятся на комбинации трёх методов: striping, mirroring и parity.
Striping – определяет способ сохранения по принципу полосатой (striping) линии – первый блок данных хранится на одном носителе, второй на другом и т. д. Это позволяет распределить данные по нескольким носителям и получить выигрыш в производительности за счет перекрытия операций ввода/вывода (I/O), которые будут выполняться одновременно для разных носителей. Условие – наличие минимум двух дисков.
Mirroring – обеспечивает зеркалирование записанной информации. При использовании метода информация дублируется минимум на двух обязательных дисках. Дает возможность обеспечить требуемый уровень избыточности данных.
Parity – предусматривает кодировку данных, записываемых на диск с получением значений четности. Информация о четности генерируется в автоматическом режиме при записи данных на носителе, что позволяет повысить уровень отказоустойчивости дисковой подсистемы.
Основные уровни RAID
Рассмотрим основные уровни RAID и их конфигурацию.
RAID 0. Информация хранится минимум на двух носителях методом striping.
Преимущества – высокий уровень производительности, поскольку запись и считывание данных могут происходить одновременно на всех дисках.
Издержки – отсутствует избыточность данных, что не позволяет их восстановить в случае сбоя одного из носителей.
Применение – для приложений, требующих высокий уровень производительности без критических данных.
RAID 5. Информация хранится минимум на трех носителях с комбинированием методов striping и parity.
Достоинства – высокий уровень производительности при считывании информации и умеренный при записи; высокий уровень избыточности, что позволяет сохранить данные при выходе из строя одного диска.
Недостатки – рабочая емкость меньше общей из-за необходимости выделения одного носителя для записи значений четности parity.
Применение – для сред с высокими требованиями к емкости хранилища и избыточности данных – NAS-хранилища, файловые серверы и т.д.
RAID 6 – усовершенствованный вариант RAID 5, в котором поддерживается двойная четность.
Достоинства – высокий уровень надежности.
Недостатки – уменьшенная скорость записи; потеря рабочей емкости по сравнению с RAID 5.
Применение – для сред с большими дисковыми массивами и длительное время восстановления: хранилища корпоративного уровня с интенсивным считыванием данных, архивные хранилища и т.д.
RAID 10. Информация хранится минимум на четырех носителях с комбинированием методов striping и mirroring. Это стандарт для production.
Преимущества – высокие значения производительности работы при записи и считывании данных; самые высокие значения избыточности, что позволяет выдержать множественные отказы дисков, если они не в одной паре.
Недостатки – рабочая емкость дисков в два раза меньше общей за счет зеркалирования.
Применение – критически важные приложения, платформы виртуализации и другие среды, для которых важны избыточность и скорость работы.
Сравнительная таблица
В Таблице 1 приведены результаты сравнения RAID уровней.
Таблица 1. Сравнительная характеристика уровней RAIDпо основным параметрам.
| Параметр | RAID 0 | RAID 1 | RAID 5 | RAID 6 | RAID 10 |
|---|---|---|---|---|---|
| Надежность | Низкая | Высокая | Высокая (1 диск) | Высокая (2 диска) | Высокая |
| Скорость | Высокая | Высокая (чтение) | Высокая (чтение), средняя (запись) | Высокая (чтение), ниже (запись) | Высокая |
| Потеря объема | Нет | 1/2 | − 1 диск | − 2 диска | 1/2 |
| Мин. дисков | 2 | 2 | 3 | 4 | 4 |
RAID ≠ Backup
Системы резервного копирования (backup) и RAID-массивы – принципиально разные инструменты для защиты данных. Каждый из них выполняет эту задачу по-своему, внося свой вклад в «общее дело» защиты данных.
Основная цель применения RAID – обеспечить стабильность работы дисковой подсистемы и повысить ее производительность.
Резервирование применяется для защиты данных от любых угроз – аппаратные сбои, ошибки программ или пользователей, внешние катаклизмы и т. д. Поэтому это является более универсальным средством защиты по сравнению с RAID, поскольку охватывает все направления появления угроз, как изнутри, так и извне.
Для оценки эффективности работы обоих инструментов можно использовать целевые показатели или метрики времени восстановления RTO (Recovery Time Objectives) и точки восстановления RPO (Recovery Point Objectives), формально применив их к обоим инструментам. Первый параметр определяет максимально допустимое время восстановления данных после сбоя. Второй указывает на максимально допустимый объем потерь данных во времени.
Практика доказала, что для RAID-массива значение RTO обычно минимальное, поскольку сразу после сбоя можно почти без задержки продолжить работу с данными, например быстро переключиться на зеркальный диск (легкая доступность). В то же время, значение параметра RPO может быть достаточно значительным, например, в случае, если вскоре перед сбоем данные удалялись или редактировались. Поэтому восстановить их будет невозможно.
Для бекапов значения обоих параметров управляемые, поскольку все зависит от настроек, и поэтому можно легко достичь тех показателей, которые нужны для быстрого восстановления данных с минимальными потерями.
Рассмотрим дееспособность каждого из инструментов на практических примерах.
Ситуация первая – случайно пользователь удалил файлы. RAID здесь не поможет, поскольку не защищает данные на уровне тома. Но можно использовать бекап и восстановить последнюю сохраненную копию.
Ситуация вторая – Активизировался вирус / ransomware, после чего данные были утрачены. Здесь также лучше всего сможет помочь восстановление данных из резервной копии.
Ситуация третья – По вине Администратора дисковая система сервера вышла из строя вместе с RAID-массивом (перепутанные провода питания). Решением будет полная замена всех дисков и восстановление данных из бекапа в облаке.
Ситуация четвертая – В результате пожара сервер был полностью выведен из строя. Здесь сможет помочь только бекап в облаке, как и в предыдущем случае.
Таким образом, можно заключить, что в отличие от бекапов, RAID не защищает от потери данных.
Если вы хотите подробнее разобраться, как правильно организовать защиту данных и резервное копирование, рекомендуем прочитать: Основы резервного копирования: защита данных .
Какой RAID выбрать
Приведем ряд рекомендаций для выбора нужного уровня RAID в зависимости от типа проекта/вычислительной системы:
Http-сервер → RAID 10 Сервер баз данных → RAID 10 Платформы виртуализации → RAID 10 Файловый сервер → RAID 1 NAS-хранилище → RAID 6 Временные некритические данные → RAID 0
Software vs Hardware RAID
RAID-массив может быть реализован как на уровне операционной системы (ОС), так и на аппаратном уровне. В первом случае функциональность дискового массива обеспечивается ядром операционной системы или специализированными приложениями с использованием вычислительных ресурсов ЦП хост-системы. Во втором случае функциональность массива обеспечивается автономными RAID-контроллерами с собственными кэш-памятью и специализированным ПО. Это позволяет аппаратным RAID-устройствам быть полностью автономными. Соответственно преимущества и недостатки обоих видов массивов обусловливаются их строением.
ZFS — это не только аналог программного RAID, но и полноценная файловая система со встроенным менеджером томов. Она использует механизм RAID-Z для обеспечения отказоустойчивости, который по принципу подобен RAID 5, но имеет важные отличия: динамическую ширину полос, отсутствие проблемы write hole и использование copy-on-write.
Дополнительные возможности, такие как контроль целостности данных (checksums), self-healing и snapshots, реализуются на уровне самой файловой системы ZFS, а не RAID-Z.
В Таблице 2 приведена сравнительная характеристика наиболее распространенных видов RAID-массивов.
Таблица 2. Сравнительная черта разных видов RAID-массивов.
| Параметр | Программный RAID (mdadm) | Программный RAID (ZFS RAID-Z) | Аппаратный RAID |
|---|---|---|---|
| Производительность | Высокая (зависит от ЦП и ОЗУ) | Высокая (зависит от ЦП и ОЗУ) | Высокая (зависит от контроллера) |
| Защита данных | Низкая (только уровень дисков, XOR) | Средняя (контроль блоков, checksums) | Высокая (аппаратная защита) |
| Надежность | Низкая (зависит от хоста) | Средняя (контроль целостности) | Высокая (независим от ОС) |
| Ремонт и замена | Просто | Просто | Требует аналогичного контроллера |
| Стоимость | Без затрат | Без затрат | Требуется оборудование |
Практика / Реальный опыт
Решение об избрании того или иного RAID должно приниматься на основании требований к основным показателям проекта – производительность, надежность, уровень защиты, бюджет и т.д. К примеру, для дата-центров на первый план получается надежность, определяющая время безотказной работы устройства (uptime). Для этого их сервера оборудуются RAID с лучшими значениями этого параметра, согласно Таблице 1 – RAID 5, 6 (двойная четность) или 10.
Практическое решение от FREEhost.UA
В инфраструктуре дата-центра FREEhost.UA мы используем разные подходы к хранению данных в зависимости от задач.
Для услуг виртуального хостинга мы выбрали ZFS, поскольку она объединяет механизмы отказоустойчивости, контроль целостности данных и удобную работу со снапшотами и пулами. Это позволяет обеспечить высокую надежность и гибкость при работе с большим количеством аккаунтов.
Для более простых систем, таких как выделенные серверы, часто используется классическое зеркало (RAID 1) – как на базе программного RAID (mdadm), так и аппаратных RAID-контроллеров. Такой подход простой, предсказуемый и достаточный для большинства задач.
Для VPS-услуг мы используем распределенное файловое хранилище на базе Ceph. Оно позволяет масштабировать систему, обеспечивать отказоустойчивость на уровне кластера и гибко управлять ресурсами.
Смотрите также.
Если вы используете Proxmox, стоит отдельно настроить резервное копирование. Подробнее об этом — в нашей инструкции.
Подписывайтесь на наш Telegram-канал https://t.me/freehostua, чтобы быть в курсе новых полезных материалов.
Смотрите наш канал YouTube на https://www.youtube.com/freehostua.
Мы в чем ошиблись, или что-то пропустили?
Напишите об этом в комментариях, мы с удовольствием ответим и обсуждаем Ваши замечания и предложения.
|
Дата: 16.04.2026 Автор: Александр Ровник
|
|

Авторам статьи важно Ваше мнение. Будем рады его обсудить с Вами:
comments powered by Disqus