Какой RAID выбрать: сравнение уровней и почему это не backup

Мы уверенны что среди наших клиентов, есть много профессионалов IT, работающих над интересными проектами. Если у Вас возникает желание рассказать о них, Вы можете разместить статью в нашем блоге. А чтоб было интересней, мы сделали конкурс статей, каждый месяц три победителя будут получать призы.

Категории

Статья также доступна на украинском (перейти к просмотру).

Узнайте, как правильно выбрать RAID для конкретной задачи. Сравнение RAID 0, 1, 5, 6, 10 – преимущества и недостатки

Содержание:

Обеспечение сохранности данных на сервере является одним из ключевых приоритетов для любого проекта. Для этого используется ряд стратегий, основные из которых — RAID-массивы и системы резервного копирования (backup). Каждый из подходов имеет свои особенности применения и назначение. Рассмотрим их подробнее, чтобы проще было выбрать оптимальный способ защиты данных для своего проекта.

Что такое RAID и зачем он нужен

RAID (Redundant Array of Independent Disks) — это технология, позволяющая повысить надежность дисковой системы и улучшить доступность данных за счёт избыточности и способа их организации. Физически это реализуется с помощью набора HDD или SSD дисков, объединённых в один логический диск.

Конфигурация RAID может отличаться в зависимости от выбранного уровня (0, 1, 4, 5, 6, 10), который определяет схему организации данных. Соответственно, уровень избыточности, производительность и емкость системы будут различаться.

Использование RAID не гарантирует сохранность данных в критической ситуации, а лишь повышает отказоустойчивость дисковой подсистемы, например при сбоях. Все остальные «катастрофы» — случайное удаление файлов, вирус, целенаправленная атака — могут привести к безвозвратной потере информации. RAID не защищает данные на уровне тома, поэтому его наличие не отменяет необходимость регулярных резервных копий.

Базовые принципы работы

Все конфигурации RAID строятся на комбинации трёх методов: striping, mirroring и parity.

Striping – определяет способ сохранения по принципу полосатой (striping) линии – первый блок данных хранится на одном носителе, второй на другом и т. д. Это позволяет распределить данные по нескольким носителям и получить выигрыш в производительности за счет перекрытия операций ввода/вывода (I/O), которые будут выполняться одновременно для разных носителей. Условие – наличие минимум двух дисков.

Mirroring – обеспечивает зеркалирование записанной информации. При использовании метода информация дублируется минимум на двух обязательных дисках. Дает возможность обеспечить требуемый уровень избыточности данных.

Parity – предусматривает кодировку данных, записываемых на диск с получением значений четности. Информация о четности генерируется в автоматическом режиме при записи данных на носителе, что позволяет повысить уровень отказоустойчивости дисковой подсистемы.

Основные уровни RAID

Рассмотрим основные уровни RAID и их конфигурацию.

RAID 0. Информация хранится минимум на двух носителях методом striping.

Преимущества – высокий уровень производительности, поскольку запись и считывание данных могут происходить одновременно на всех дисках.

Издержки – отсутствует избыточность данных, что не позволяет их восстановить в случае сбоя одного из носителей.

Применение – для приложений, требующих высокий уровень производительности без критических данных.

RAID 5. Информация хранится минимум на трех носителях с комбинированием методов striping и parity.

Достоинства – высокий уровень производительности при считывании информации и умеренный при записи; высокий уровень избыточности, что позволяет сохранить данные при выходе из строя одного диска.

Недостатки – рабочая емкость меньше общей из-за необходимости выделения одного носителя для записи значений четности parity.

Применение – для сред с высокими требованиями к емкости хранилища и избыточности данных – NAS-хранилища, файловые серверы и т.д.

RAID 6 – усовершенствованный вариант RAID 5, в котором поддерживается двойная четность.

Достоинства – высокий уровень надежности.

Недостатки – уменьшенная скорость записи; потеря рабочей емкости по сравнению с RAID 5.

Применение – для сред с большими дисковыми массивами и длительное время восстановления: хранилища корпоративного уровня с интенсивным считыванием данных, архивные хранилища и т.д.

RAID 10. Информация хранится минимум на четырех носителях с комбинированием методов striping и mirroring. Это стандарт для production.

Преимущества – высокие значения производительности работы при записи и считывании данных; самые высокие значения избыточности, что позволяет выдержать множественные отказы дисков, если они не в одной паре.

Недостатки – рабочая емкость дисков в два раза меньше общей за счет зеркалирования.

Применение – критически важные приложения, платформы виртуализации и другие среды, для которых важны избыточность и скорость работы.

Сравнительная таблица

В Таблице 1 приведены результаты сравнения RAID уровней.

Таблица 1. Сравнительная характеристика уровней RAIDпо основным параметрам.

Параметр	RAID 0	RAID 1	RAID 5	RAID 6	RAID 10
Надежность	Низкая	Высокая	Высокая (1 диск)	Высокая (2 диска)	Высокая
Скорость	Высокая	Высокая (чтение)	Высокая (чтение), средняя (запись)	Высокая (чтение), ниже (запись)	Высокая
Потеря объема	Нет	1/2	− 1 диск	− 2 диска	1/2
Мин. дисков	2	2	3	4	4

RAID ≠ Backup

Системы резервного копирования (backup) и RAID-массивы – принципиально разные инструменты для защиты данных. Каждый из них выполняет эту задачу по-своему, внося свой вклад в «общее дело» защиты данных.

Основная цель применения RAID – обеспечить стабильность работы дисковой подсистемы и повысить ее производительность.

Резервирование применяется для защиты данных от любых угроз – аппаратные сбои, ошибки программ или пользователей, внешние катаклизмы и т. д. Поэтому это является более универсальным средством защиты по сравнению с RAID, поскольку охватывает все направления появления угроз, как изнутри, так и извне.

Для оценки эффективности работы обоих инструментов можно использовать целевые показатели или метрики времени восстановления RTO (Recovery Time Objectives) и точки восстановления RPO (Recovery Point Objectives), формально применив их к обоим инструментам. Первый параметр определяет максимально допустимое время восстановления данных после сбоя. Второй указывает на максимально допустимый объем потерь данных во времени.

Практика доказала, что для RAID-массива значение RTO обычно минимальное, поскольку сразу после сбоя можно почти без задержки продолжить работу с данными, например быстро переключиться на зеркальный диск (легкая доступность). В то же время, значение параметра RPO может быть достаточно значительным, например, в случае, если вскоре перед сбоем данные удалялись или редактировались. Поэтому восстановить их будет невозможно.

Для бекапов значения обоих параметров управляемые, поскольку все зависит от настроек, и поэтому можно легко достичь тех показателей, которые нужны для быстрого восстановления данных с минимальными потерями.

Рассмотрим дееспособность каждого из инструментов на практических примерах.

Ситуация первая – случайно пользователь удалил файлы. RAID здесь не поможет, поскольку не защищает данные на уровне тома. Но можно использовать бекап и восстановить последнюю сохраненную копию.

Ситуация вторая – Активизировался вирус / ransomware, после чего данные были утрачены. Здесь также лучше всего сможет помочь восстановление данных из резервной копии.

Ситуация третья – По вине Администратора дисковая система сервера вышла из строя вместе с RAID-массивом (перепутанные провода питания). Решением будет полная замена всех дисков и восстановление данных из бекапа в облаке.

Ситуация четвертая – В результате пожара сервер был полностью выведен из строя. Здесь сможет помочь только бекап в облаке, как и в предыдущем случае.

Таким образом, можно заключить, что в отличие от бекапов, RAID не защищает от потери данных.

Если вы хотите подробнее разобраться, как правильно организовать защиту данных и резервное копирование, рекомендуем прочитать: Основы резервного копирования: защита данных .

Какой RAID выбрать

Приведем ряд рекомендаций для выбора нужного уровня RAID в зависимости от типа проекта/вычислительной системы:

Http-сервер → RAID 10
Сервер баз данных → RAID 10
Платформы виртуализации → RAID 10
Файловый сервер → RAID 1
NAS-хранилище → RAID 6
Временные некритические данные → RAID 0

Software vs Hardware RAID

RAID-массив может быть реализован как на уровне операционной системы (ОС), так и на аппаратном уровне. В первом случае функциональность дискового массива обеспечивается ядром операционной системы или специализированными приложениями с использованием вычислительных ресурсов ЦП хост-системы. Во втором случае функциональность массива обеспечивается автономными RAID-контроллерами с собственными кэш-памятью и специализированным ПО. Это позволяет аппаратным RAID-устройствам быть полностью автономными. Соответственно преимущества и недостатки обоих видов массивов обусловливаются их строением.

ZFS — это не только аналог программного RAID, но и полноценная файловая система со встроенным менеджером томов. Она использует механизм RAID-Z для обеспечения отказоустойчивости, который по принципу подобен RAID 5, но имеет важные отличия: динамическую ширину полос, отсутствие проблемы write hole и использование copy-on-write.

Дополнительные возможности, такие как контроль целостности данных (checksums), self-healing и snapshots, реализуются на уровне самой файловой системы ZFS, а не RAID-Z.

В Таблице 2 приведена сравнительная характеристика наиболее распространенных видов RAID-массивов.

Таблица 2. Сравнительная черта разных видов RAID-массивов.

Параметр	Программный RAID (mdadm)	Программный RAID (ZFS RAID-Z)	Аппаратный RAID
Производительность	Высокая (зависит от ЦП и ОЗУ)	Высокая (зависит от ЦП и ОЗУ)	Высокая (зависит от контроллера)
Защита данных	Низкая (только уровень дисков, XOR)	Средняя (контроль блоков, checksums)	Высокая (аппаратная защита)
Надежность	Низкая (зависит от хоста)	Средняя (контроль целостности)	Высокая (независим от ОС)
Ремонт и замена	Просто	Просто	Требует аналогичного контроллера
Стоимость	Без затрат	Без затрат	Требуется оборудование

Практика / Реальный опыт

Решение об избрании того или иного RAID должно приниматься на основании требований к основным показателям проекта – производительность, надежность, уровень защиты, бюджет и т.д. К примеру, для дата-центров на первый план получается надежность, определяющая время безотказной работы устройства (uptime). Для этого их сервера оборудуются RAID с лучшими значениями этого параметра, согласно Таблице 1 – RAID 5, 6 (двойная четность) или 10.

Практическое решение от FREEhost.UA

В инфраструктуре дата-центра FREEhost.UA мы используем разные подходы к хранению данных в зависимости от задач.

Для услуг виртуального хостинга мы выбрали ZFS, поскольку она объединяет механизмы отказоустойчивости, контроль целостности данных и удобную работу со снапшотами и пулами. Это позволяет обеспечить высокую надежность и гибкость при работе с большим количеством аккаунтов.

Для более простых систем, таких как выделенные серверы, часто используется классическое зеркало (RAID 1) – как на базе программного RAID (mdadm), так и аппаратных RAID-контроллеров. Такой подход простой, предсказуемый и достаточный для большинства задач.

Для VPS-услуг мы используем распределенное файловое хранилище на базе Ceph. Оно позволяет масштабировать систему, обеспечивать отказоустойчивость на уровне кластера и гибко управлять ресурсами.

Смотрите также.

Если вы используете Proxmox, стоит отдельно настроить резервное копирование. Подробнее об этом — в нашей инструкции.

Подписывайтесь на наш Telegram-канал https://t.me/freehostua, чтобы быть в курсе новых полезных материалов.

Смотрите наш канал YouTube на https://www.youtube.com/freehostua.

Мы в чем ошиблись, или что-то пропустили?

Напишите об этом в комментариях, мы с удовольствием ответим и обсуждаем Ваши замечания и предложения.

RAID: какой уровень выбрать и почему RAID — это не backup