Что такое Tier и зачем на него ориентироваться?
Дата-центры сегодня — не просто серверы в помещении, а продукт с набором четко измеряемых характеристик: доступность, отказоустойчивость, стоимость владения и экологичность. Если вы проектируете коммерческий ЦОД и ориентируетесь на крупных игроков рынка, то необходим высокий уровень надежности и отказоустойчивости. Как минимум Tier III, в ряде случаев Tier IV.
Проектировать ЦОД Tier II или без резервирования вовсе можно только в случае, если вы строите его под заказчика, где это является одним из условий (на практике такого не встречали), либо есть цель привлечь крайне низкомаржинальный сегмент аудитории. При этом отказоустойчивость такого ЦОД никак не декларируется на рынке и не обсуждается.
Что такое Tier
Tier — это международная система классификации уровня инфраструктуры дата-центров, разработанная Uptime Institute. Она описывает архитектуру электроснабжения и охлаждения, а также уровень отказоустойчивости и возможность обслуживания без отключений. Tier напрямую влияет на SLA, цену размещения и позиционирование на рынке.
Краткая характеристика Tier I–IV
Tier I — базовый уровень
– Однократная (single) распределительная линия питания и охлаждения, минимальное резервирование.
– Подходит для небольших офисных серверных и ненапряженных нагрузок.
– Ожидаемая годовая доступность ~99.671% (примерно 28,8 часа простоя в год).
– Низкая стоимость, минимальные гарантии и требования к обслуживанию.
Tier II — повышенная надежность компонентов
– Наличие резервных компонентов (N+1) для ключевых систем, но одна рабочая линия.
– Доступность ~99.741% (порядка 22 часов простоя в год).
– Подходит для средних предприятий, где важна защита от отказов отдельных элементов.
Tier III — concurrent maintainability (возможность обслуживания без остановки)
– Множественные пути распределения (но один активный), компоненты резервируются (N+1 или 2N).
– Можно проводить плановое обслуживание без прерывания услуг.
– Доступность ~99.982% (около 1,6 часа простоя в год).
– Часто используется для коммерческих колокаций и сервис‑провайдеров с высокими SLA.
Tier IV — fault tolerant (устойчивость к отказываниям)
– Полная резервность на уровне 2N или 2(N+1), несколько активных линий, избыточность всех компонентов.
– Система выдерживает сбой и поддерживает работу без перерыва.
– Доступность ~99.995% (примерно 0,4 часа простоя в год).
– Целевой сегмент: финансовые, критически важные инфраструктуры, облачные гиганты — высокая стоимость, сложная эксплуатация.
Как Tier соотносится с бизнесом: Небольшие e‑commerce или внутренние тестовые ресурсы часто ограничиваются Tier I–II; SaaS, банки и крупные представители бизнеса — Tier III–IV.
Резервирование и обозначения (N, N+1, 2N…)
- N — минимально необходимая емкость.
- N+1 — один резервный модуль сверх необходимого.
- 2N — полное дублирование всех систем.
- 2(N+1) или 2N+1 — комбинированная схема для еще большей надежности.
Эти обозначения помогают объяснить клиентам, за что они платят:
больше резервирования — выше отказоустойчивость и SLA, следовательно выше CAPEX и OPEX ЦОД.
Системы охлаждения: основные типы
Охлаждение — ключ к энергоэффективности (PUE) и возможности размещать плотные нагрузки (GPU, HPC).
Ниже — обзор решений с плюсами и минусами.
Воздушное охлаждение с CRAC/CRAH
CRAC (Computer Room Air Conditioner) — компрессорно‑фреоновая охладительная установка.
CRAH — воздухоохладитель с использованием чиллера и холодной воды.
- Плюсы: проверенная технология, простота установки.
- Минусы: ограничена плотность на стойку, относительно высокие энергозатраты при высокой плотности.
Холодный и горячий коридор
Изоляция холодных и горячих потоков воздуха для повышения эффективности.
- Плюсы: значительное снижение PUE, позволяет существующим системам работать эффективнее.
- Минусы: требует доработки планировки и контроля воздушных потоков.
In‑row и in‑rack охлаждение
Охладители устанавливаются между стойками (in‑row) или прямо в стойке (in‑rack).
- Плюсы: эффективная локальная вентиляция, подходит для средних и высоких плотностей
- Минусы: сложнее обслуживание, требует продуманной инфраструктуры жидкости/питания.
Жидкостное охлаждение (rear‑door heat exchangers, direct‑to‑chip)
Теплообменники на двери стоек, поли‑трубопровод к процессору (переход на liquid).
- Плюсы: высокая плотность охлаждения, меньший шум/энергозатраты.
- Минусы: большая сложность, требования к безопасной гидравлической инфраструктуре, потенциальные риски протечек.
Погружное (immersion) охлаждение
Оборудование погружают в диэлектрическую жидкость.
- Плюсы: максимальная эффективность для GPU/HPC, компактность, низкие энергопотери на циркуляцию воздуха.\
- Минусы: нестандартная эксплуатация, специальные требования к оборудованию и обслуживанию.
Экомониторинг и свободное охлаждение (free cooling, economizer)
Использование наружного воздуха (в регионах с умеренным климатом), адиабатик‑системы.
- Плюсы: снижение затрат на чиллеры, улучшение PUE.
- Минусы: климатозависимость, требуется фильтрация и контроль влажности.
Как выбрать систему охлаждения под Tier и бизнес‑задачи
- Для Tier I–II (низкая критичность): традиционные CRAC/CRAH + холодный коридор. Бюджетное решение, быстро внедряется.
- Для Tier III: сочетание CRAH/CRAC с контейнментом и in‑row для повышения эффективности и возможности обслуживания.
- Для Tier IV и плотных вычислительных нагрузок: жидкостные решения (direct‑to‑chip, immersion) и полная дублирующая инфраструктура. Экономически оправдано при высоких требованиях к SLA и плотности.
Таким образом, можно сделать вывод, что проектирование ЦОД Tier 3 и выше — это, фактически, сегодняшняя действительность, так как большинство сложных систем и вычислений требуют надежности и стабильной связности. Требования бизнеса также достаточно высоки. Никто не готов быть аутсайдером и терять клиентов и выручку.