Бэкапы сайта: RPO и RTO простыми словами + как выбрать схему резервного копирования

Суть в 2 строках:

RPO — сколько данных вы готовы потерять (в минутах/часах).
RTO — сколько времени сайт может быть недоступен (в минутах/часах).

Если эти два числа не определены, «у нас есть бэкап» — это не стратегия, а надежда.

Почему «бэкап есть» часто не спасает

Типовая картина при аварии: сайт лежит, владелец просит «восстановите быстро», а дальше выясняется, что:

копия делалась раз в сутки (а бизнес живёт по минутам);
копия хранится на том же сервере или в том же аккаунте;
восстановление никто никогда не тестировал;
нет понимания, что важнее: данные или время простоя.

RPO/RTO нужны, чтобы заранее согласовать ожидания и техническую схему, а не спорить в момент инцидента.

Термины на человеческом языке

RPO (Recovery Point Objective) — «точка отката по данным»

Это максимально допустимая потеря данных по времени.

Пример: RPO = 30 минут. Если авария случилась в 12:00, то в худшем случае вы откатитесь к данным на 11:30 и потеряете всё, что было с 11:30 до 12:00:

заявки из форм;
заказы;
изменения статусов;
новые пользователи;
новые товары/цены (если менялись).

RTO (Recovery Time Objective) — «время возврата в строй»

Это время, за которое сервис должен снова работать после инцидента.

Важно: «сервер подняли» не равно «сайт работает как бизнес». Обычно нужно проверить, что:

сайт открывается;
формы отправляются;
админка доступна;
интеграции не ломают заказы (оплаты/доставка/CRM);
данные не повреждены.

Быстрая таблица последствий

Параметр	Значение	Что это означает в реальности
RPO	15 минут	Максимум потеряете данные за 15 минут работы
RPO	1 час	Потеря часа заявок/заказов/изменений — это «нормально по договору»
RPO	24 часа	Потеря суток — подходит только для нетранзакционных проектов
RTO	30 минут	Нужна отлаженная процедура восстановления и часто отдельная инфраструктура
RTO	4 часа	Реалистично для большинства бизнес-сайтов при грамотных бэкапах
RTO	24 часа	Это не аварийное восстановление, а «когда руки дойдут»

Какие инциденты закрывают бэкапы (и какие — нет)

Бэкапы помогают, когда:

удалили/исказили контент или товары;
обновление CMS/модуля сломало сайт;
база данных повредилась;
хостинг «упал»;
файлы или таблицы зашифровали (если копии хранятся правильно).

Бэкапы не заменяют:

защиту (обновления, доступы, WAF, антибот);
мониторинг (чтобы узнать о проблеме сразу);
отказоустойчивость (когда нужен RTO в считанные минуты).

Если нужен RTO «почти ноль», одними бэкапами не обойтись: потребуется кластер/репликация/горячий резерв — и всё равно бэкапы остаются обязательными (репликация размножает и ошибки тоже).

От бизнеса к цифрам: как поставить RPO/RTO без «пальцем в небо»

Шаг 1. Сколько стоит час простоя

Считайте по простому: реклама продолжает крутиться (или останавливается с задержкой), заявки/заказы не приходят, поддержка получает шквал сообщений, падает доверие.

Практическая оценка: стоимость простоя ≈ маржинальная прибыль/час + рекламный бюджет/час + стоимость «пожара» (люди/нервы/репутация).

Шаг 2. Сколько стоит потеря данных

Потеря данных — это не только «заявки пропали». Обычно следом идут ручной разбор по почте/мессенджерам, расхождения в оплатах и статусах, претензии клиентов, повторные отгрузки и возвраты.

Шаг 3. 7 вопросов, которые превращают «хочу надёжно» в требования

Есть ли онлайн-оплаты?
Сколько заказов/лидов в час?
Что критичнее: данные или время?
Есть ли дубль данных (CRM, почта, коллтрекинг)?
Как часто меняется контент/цены/остатки?
Какие интеграции нельзя просто «откатить» (оплаты/доставка/1С)?
Кто конкретно восстанавливает и где инструкция?

Типовые ориентиры RPO/RTO по проектам

Это не «закон», а стартовая точка для разговора о рисках и бюджете.

Тип проекта	Разумный RPO	Разумный RTO	Комментарий
Контент-сайт/витрина	24 часа	4–12 часов	Если нет критичных заявок и частых правок
Корпоративный сайт с лидами	1–6 часов	2–6 часов	Заявки важнее, чем кажется
Интернет-магазин	15–60 минут	1–4 часа	Иначе потери и хаос в заказах
Личный кабинет/портал	5–30 минут	30–120 минут	Там уже сервис, а не просто сайт

Что именно бэкапить: чек-лист объектов

Частая ошибка: сохраняют «файлы сайта», а теряют бизнес-данные. Минимальный набор:

база данных;
uploads / пользовательские файлы (изображения, документы, медиа);
конфигурация (веб-сервер, cron/агенты, переменные окружения);
ключи и секреты (хранить отдельно и безопасно: токены, API-ключи, доступы);
служебные данные по ситуации: очереди, поисковые индексы, кеши.

Если проект на CMS (например, 1C-Битрикс), чаще всего критично: база + upload + корректная процедура восстановления окружения.

Схемы резервного копирования: что выбрать

«Раз в сутки на хостинге»
- Кому подходит: простой контент-сайт без постоянных заявок/оплат.
- Риски: RPO почти всегда сутки, RTO часто непредсказуем (особенно если восстановление вручную).
Частые бэкапы базы + регулярные копии файлов
- Кому подходит: лидогенерация, магазины, сервисы.
- Логика: база меняется постоянно — её копируем чаще. Файлы меняются реже — можно реже, но стабильно.
3-2-1 — рабочая классика
- 3 копии (включая прод), 2 разных носителя/среды, 1 — вне площадки.
- Ключевое: «вне площадки» — не «в другом каталоге на том же сервере», а другая площадка/облако или хотя бы отдельный аккаунт и права.
Offsite + неизменяемость (immutability) — защита от шифровальщиков
- Если злоумышленник может удалять копии, offsite без защиты — слабое место.
- Неизменяемость означает: копии нельзя удалить/перезаписать в течение заданного времени (policy).
Репликация/кластер/горячий резерв — это не бэкап
- Это про доступность (RTO), а не про «вернуться к чистому состоянию».
- Репликация легко размножает ошибки, повреждение данных и шифрование — поэтому она дополняет, а не заменяет бэкапы.

Как выбрать схему: практическая матрица решений

Условия	Рекомендация по схеме
Сайт-витрина, правки редкие	1 раз/сутки + хранение 14–30 дней + 1 копия вне площадки
Есть лиды/формы, но без оплат	База каждые 1–6 часов + файлы 1 раз/сутки + offsite
Интернет-магазин, заказы постоянно	База каждые 15–60 минут + файлы 1–6 часов + offsite + защита от удаления
Нужен RTO < 1 часа	Добавить отказоустойчивость/горячий резерв + строгий регламент + регулярные тесты
Требования к защите от взлома высокие	Offsite + неизменяемые копии + раздельные доступы + аудит действий

Частота, хранение, доступы: минимум, который реально работает

Частота:

База: от 15 минут до 6 часов — в зависимости от RPO.
Файлы: от 1 часа до 24 часов — в зависимости от активности загрузок/контента.
Важно: частоту выбирают не «как удобно», а чтобы она попадала в RPO.

Хранение (retention):

Практичный вариант для большинства проектов:

ежедневные — 7–14 дней;
недельные — 4–8 недель;
месячные — 3–6 месяцев (если нужно для разборов/регуляторики).

Доступы и безопасность:

отдельные учётные записи/ключи для хранилища;
минимальные права (не всем — удаление);
2FA, аудит действий;
отдельное хранение секретов (чтобы восстановление не упёрлось в «где токен оплаты?»).

Тест восстановления: единственный честный способ узнать свой RTO

Бэкап считается рабочим только если вы восстановились на тестовом окружении и проверили контрольные точки.

Как тестировать без риска

Поднять стенд (копию окружения).
Восстановить базу и файлы из выбранной копии.
Пройти чек-лист проверки: сайт, админка, формы, заказы (тест), критичные интеграции, целостность данных.
Зафиксировать фактическое время восстановления и проблемы.

Как часто

Минимум раз в квартал.
Обязательно после крупных обновлений, миграций, смены хостинга, внедрения интеграций.

Что делать при аварии: короткий регламент (runbook)

Фиксация: время, симптомы, что менялось перед падением.
Стоп изменений: заморозить деплой и ручные правки, ограничить доступы при подозрении на взлом.
Классификация: ошибка обновления / сбой хостинга / подозрение на взлом / повреждение базы.
Решение: откат релиза / восстановление из копии / перенос на резерв.
Проверка бизнеса: формы, корзина/заказ, оплаты (статусы), доставка, CRM/1С/почта.
Пост-инцидент: выводы, изменение схемы бэкапов и доступов, обновление инструкции восстановления.

Типовые ошибки, из-за которых бэкапы не спасают

копии хранятся на том же сервере или в том же аккаунте;
бэкап есть, но никто не знает, как восстановить;
копируют только файлы без базы (или наоборот);
не копируют uploads, теряют изображения/документы;
нет защиты от удаления/шифрования копий;
«RTO на словах», а по факту восстановление занимает сутки;
нет мониторинга бэкапов (копирование тихо падает неделями).

Чек-лист «минимально нормально»

RPO и RTO зафиксированы (хотя бы ориентиры).
Бэкапится база + uploads + конфиги для восстановления.
Есть копия вне площадки.
Доступ к хранилищу ограничен, включена 2FA.
Понятна частота и срок хранения копий.
Есть инструкция восстановления (короткая, пошаговая).
Назначен ответственный (поимённо).
Есть регулярный тест восстановления и протокол результата.
Есть мониторинг успешности бэкапов и уведомления о сбоях.
После релизов/интеграций — внеплановый тест.

FAQ: короткие ответы

Что важнее — RPO или RTO?

Зависит от бизнеса: магазину часто важны оба; витрине обычно важнее RTO; сервису/личному кабинету чаще критичны оба.

Если у меня репликация, бэкапы не нужны?

Нужны. Репликация повышает доступность, но может размножить ошибки и шифрование. Бэкапы нужны, чтобы вернуться к чистому состоянию.

Можно ли просто откатиться после взлома?

Только если копии защищены от удаления/шифрования и хранение отделено от прод-доступов. Иначе злоумышленник часто уничтожает копии.

Как часто делать бэкап базы интернет-магазина?

Обычно каждые 15–60 минут. Если заказов мало — можно реже, но это решение должно вытекать из RPO.

Сколько хранить бэкапы?

Минимум 14–30 дней для ежедневных, плюс недельные/месячные по необходимости. Дольше — если есть юридические причины или длинные расследования.

Что бэкапить в первую очередь: файлы или базу?

Для бизнеса почти всегда база критичнее (заказы, заявки, пользователи). Но без uploads восстановление может быть «формально успешным», а по факту сайт будет без контента.

Как понять, что мои бэкапы реально работают?

Сделать тест восстановления на стенде и измерить фактический RTO.

Вывод

Правильные бэкапы — это система: цели (RPO/RTO), схема хранения (включая offsite и защиту), регламент восстановления и регулярные тесты. Если один из элементов отсутствует, риск «не восстановиться вовремя» остаётся высоким.

Святослав Семенов

Программист по поддержке сайтов в Cetera Labs

Занимаюсь поддержкой сайтов всех типов, интернет-магазинов, маркетплейсов, личных кабинетов, корпоративных порталов, PIM-систем, 1С, интернет-СМИ, CRM-систем, мобильных приложений. По выгодным абонентским и почасовым тарифам.

Бэкапы без мифов: что такое RPO и RTO простыми словами и как выбрать схему резервного копирования