DR-06 · ОПЫТ

Резервное копирование, аварийное восстановление и непрерывность, проверенные до того, как понадобятся

Я проектирую резервное копирование и аварийное восстановление так, как ими на самом деле пользуются, через восстановление. Я строю Rubrik, чтобы ваши данные были защищены и поддавались восстановлению, а затем подтверждаю это настоящими учениями по восстановлению, измеренными по целям RTO и RPO. Когда случается сбой, вы уже знаете, сколько займёт восстановление, потому что мы это проверили.

01 · Чем я занимаюсь

Реальная работа

  • Проектирую и разворачиваю архитектуру резервного копирования Rubrik для виртуальных машин, файловых ресурсов, баз данных и физических хостов, привязывая политики к тому, насколько на самом деле важна каждая рабочая нагрузка.
  • Задаю цели RTO и RPO для каждой системы, а затем выстраиваю расписание защиты так, чтобы их достигать, а не угадывать.
  • Провожу настоящие учения по восстановлению, а не проверки для галочки: полное восстановление виртуальных машин, восстановление на уровне файлов и наглядные прогоны переключения на резерв, за которыми можно следить.
  • Описываю план аварийного восстановления как документированную, упорядоченную процедуру с понятными ответственными, последовательностью и зависимостями.
  • Проверяю время восстановления по согласованным контрольным точкам, а затем настраиваю окна резервного копирования, репликацию и сроки хранения, пока цифры не станут стабильными.
  • Тестирую неизменяемость и восстановление после программ-вымогателей, чтобы плохой день не обернулся полной потерей.
  • Документирую среду, чтобы ваша команда могла восстановиться без звонка мне.

02 · Что вы получаете

Что у вас остаётся в итоге

  • Система резервного копирования, восстановление которой доказано, с документированным временем восстановления, которое можно показать руководству или аудитору.
  • Чёткие показатели RTO и RPO для каждой системы, согласованные заранее и подтверждённые в ходе тестирования.
  • Письменный план аварийного восстановления, которому ваша команда может следовать, не звоня мне.
  • Уверенность в том, что программа-вымогатель или отказ оборудования означают восстановление, а не сборку заново с нуля.

03 · Инструменты и знания

С чем я здесь работаю

04 · Как я к этому подхожу

Спланировано, очерчено и под моей ответственностью

Всё начинается с 30-минутного звонка для определения объёма работ и письменной оценки соответствия в тот же день, чтобы мы оба понимали, что входит в объём и как выглядит хороший результат. Прежде чем что-либо трогать в продакшене, я составляю документированный план изменений с откатом, где прописано, как изменятся расписания защиты, сроки хранения и репликация. Затем я вношу изменения в отведённое окно, проверяю восстановление по согласованным контрольным точкам настоящими учениями по восстановлению и беру откат на себя, если контрольная точка не пройдена. Вы получаете проверенный результат, а не результат на удачу.

Квалификация и стандартыУ меня есть CompTIA Security+, и я работаю по опубликованным стандартам, включая средства контроля планирования на случай непредвиденных обстоятельств NIST 800-53, которым подчиняются резервное копирование и восстановление, с применением усиления DoD STIG на задействованных системах. Когда угрозой является программа-вымогатель, я использую MITRE ATT&CK, чтобы восстановление учитывало, как злоумышленники добираются до резервных копий, а не только до основных данных.

05 · Вопросы

Хорошие вопросы, прямые ответы

Вы работаете только с Rubrik?

Rubrik я знаю глубже всего, поэтому именно здесь приношу больше всего пользы. Но сам метод, постановка реальных целей по RTO и RPO и их подтверждение учениями по восстановлению, применим к любой платформе, и я честно скажу, если вашей среде лучше подойдёт другой инструмент.

Что такое учение по восстановлению и почему это важно?

Это настоящее восстановление. Я поднимаю систему из резервной копии и засекаю время, а не полагаюсь на то, что задание резервного копирования отчиталось об успехе. Резервная копия, которую вы ни разу не восстанавливали, это лишь предположение. Учение по восстановлению превращает её в известное время восстановления.

Можно ли всё это настроить, не нарушая работу продакшена?

Да. Изменения резервного копирования и аварийного восстановления вносятся в отведённое окно по документированному плану изменений с возможностью отката. Учения по восстановлению проводятся на восстановленных копиях, а не на работающих системах, поэтому проверка восстановления не подвергает продакшен риску.

06 · Смежный опыт

Смежные направления, которыми я занимаюсь

Нужно, чтобы этим занялись?

Расскажите, что вы пытаетесь перенести и где застряли. Нескольких предложений достаточно для начала, и они попадут прямо в мой почтовый ящик.