Как средней российской компании построить мини‑дата‑центр на 3–5 серверах

Для российских компаний с 50–200 сотрудниками мини‑дата‑центр на 3–5 серверах — это способ уйти от хаотичного зоопарка железа к управляемой платформе виртуализации и хранения. При этом ошибка в роли серверов или выборе хранилища быстро приводит к узким местам: нет IOPS для 1C, нет резервов по дискам, а расширение выглядит как новый проект с простоем. Эта статья помогает IT‑руководителю развести вычислительные и storage‑узлы, выбрать Supermicro/Dell/HPE и заранее посчитать TCO на 3 года.

Определяем роли серверов и нагрузку

Для компании на 50–200 сотрудников ключевой риск — сделать все 3–5 серверов “чистыми вычислительными” и получить узкое место по дискам. Надёжная схема — 2–3 вычислительных узла + 1–2 узла хранения, разнесённые по ролям виртуализации, 1C/ERP и файлового сервиса.

Вычислительные узлы: 2–3 сервера под VMware/Proxmox, упор на 2×CPU и большой объём памяти (512 ГБ–1 ТБ) для плотности VM; цель — средняя загрузка CPU не выше 70% даже в пике.
Узлы хранения: 1–2 сервера с RAID6 (8+2) под SAS‑диски и/или NVMe, задачей которых является снять IOPS‑нагрузку с compute‑узлов и обеспечить резерв по дискам с допуском выхода из строя двух накопителей.
Оценка нагрузки: ориентируйтесь на формулу “число сотрудников × среднее число VM на сотрудника” и держите целевые пороги CPU <70% и заполнение хранилища <80%, чтобы избежать скрытого роста задержек.

По бюджету имеет смысл держать планку до ~5 млн ₽ на сервер, а общий бюджет проекта — до ~20 млн ₽ с резервом около 20% под запасные части и рост потребления электроэнергии. Не стоит пытаться закрывать высокие GPU‑нагрузки на тех же узлах: для рендеринга и ML проще добавить отдельные рабочие станции или специализированные GPU‑серверы.

Тип узла	Модель и платформа	CPU / память / диски	Питание / слоты	Бюджет (₽) и сценарий
Вычислительный 1–2	Supermicro SYS‑220P‑C10R (2U)	2× AMD EPYC 7452, до 1 ТБ DDR4, 8× NVMe	2×750 Вт резерв, 8× PCIe для 10G/GPU	~4–5 млн ₽, плотная виртуализация (VMware/Proxmox)
Вычислительный 3	Dell PowerEdge R7525 (2U)	2× EPYC 7302, 512 ГБ RAM, 4× SAS SSD	~1100 Вт, до 6× PCIe	~4,5 млн ₽, 1C/ERP и приложения
Хранилище 1	HPE DL380 Gen10 (2U)	2× Xeon Silver 4314, 256 ГБ RAM, 12×8 ТБ SAS HDD	2×800 Вт, до 24 LFF слотов	~5 млн ₽, RAID6‑хранилище/backup
Хранилище 2 (опция)	Supermicro 1019P‑WTR (1U)	Intel Xeon E, 128 ГБ RAM, до 8× NVMe	~550 Вт, 4× PCIe	~3 млн ₽, кеш/быстрое хранилище под VM

Архитектура хранения и резервного копирования

Основная цель по дискам — не только вместить данные, но и пережить отказ нескольких накопителей без потери сервисов. Оптимальный компромисс для мини‑ЦОД — RAID6 на storage‑узлах + снимки/backup на отдельном сервере с разделением “горячих” и “холодных” данных.

RAID‑слой: на основном storage‑узле — RAID6 (например, 8+2 диска), допускающий отказ двух HDD без потери массива; на compute‑узлах — зеркалирование 2× NVMe под критические VM и гипервизор.
ПО и снапшоты: ZFS/TrueNAS SCALE с поддержкой снимков, интеграция с Proxmox Backup Server для инкрементальных бэкапов; целевой RPO — до 1 часа, RTO — <4 часов для критичных сервисов.
Разделение данных: “горячие” данные и VM‑диски — на NVMe/SSD, “холодные” архивы и файловый обмен — на SAS HDD; суммарный объём до ~1 ПБ можно делить в пропорции 50% NVMe / 50% HDD.

Для снижения катастрофических рисков имеет смысл предусмотреть облачный резерв в российском облаке (например, Yandex) с регулярным тестированием восстановления (цель — поднять критичные сервисы менее чем за 2 часа). Важно не только снимать бэкапы, но и планово проверять восстановление 1–2 ключевых систем раз в квартал.

Сетевая архитектура и высокая доступность

Для связности 3–5 серверов достаточно простой, но грамотно разделённой архитектуры: 1G на рабочих местах, 10G между серверами и хранилищем, стеки коммутаторов для отказоустойчивости. Важно заранее продумать, какие узлы должны переживать отказ без простоя.

Доступ: Dell S3148P с 24×1G PoE на уровне доступа, стек из двух устройств для отказоустойчивости и питания IP‑телефонии/точек Wi‑Fi, подключение рабочих мест на 1G.
Агрегация: Cisco C9300 с 10G SFP+ или Dell S5248F‑ON с 25/40G uplink — для связи compute‑ и storage‑узлов; ToR‑соединения <3 м закрываются DAC, межстоечные ~100 м — SR‑модулями по OM4.
HA: compute‑узлы объединяются в кластер высокой доступности (Corosync/Proxmox VE или VMware HA), storage‑узлы используют общие LUN и механизм failover; мониторинг (Zabbix + Grafana) отслеживает CPU >80% и диски >90% заполнения с отправкой уведомлений.

Типовые ошибки и расчёт TCO на 3 года

Многие российские проекты переоценивают необходимость “всё на NVMe” и недооценивают стоимость электропитания и запасных частей. Надёжнее сразу считать 3‑летний горизонт: закупка + электроэнергия + сервис и запасные части, а также лицензирование Microsoft и альтернативы Alt Linux.

Ошибка 1 — “всё на NVMe”: в типичной виртуализации лишь 15–20% VM реально требуют максимальных IOPS. Решение: NVMe под критичные базы и кеш, SAS HDD как основной объём.
Ошибка 2 — нет резервирования по питанию: один БП на узел резко повышает риск простоя. Решение — все узлы с двойным БП (не менее 2×800 Вт) плюс резерв по UPS и дизель‑генератору на критичные серверы.
Ошибка 3 — игнор Alt Linux и открытых гипервизоров: ставка только на Microsoft увеличивает TCO и регуляторные риски. Решение — POC с Proxmox/Alt Linux, проверка совместимости драйверов и приложений до закупки лицензий.
Ошибка 4 — нет резерва по PCIe и росту: три сервера загружены “под потолок”, четвёртый добавить физически некуда. Решение — заранее планировать минимум 4 свободных PCIe‑слота в кластере для 10/25G, HBA и GPU.

Статья затрат	Годовой бюджет (млн ₽)	Итого за 3 года (млн ₽)	Комментарий
Закупка оборудования (4 узла)	~15,0	15,0	разовая закупка серверов, сетевого оборудования и стоечного железа
Электроэнергия	~0,5	~1,5	оценка при средней цене ~0,5 ₽/кВт⋅ч и умеренной нагрузке
Запчасти и обслуживание	~1,0	~3,0	≈10% от закупочной стоимости в год на SLA, диски, вентиляторы, БП
Итого TCO за 3 года	–	~19,5	без учёта стоимости лицензий и труда персонала

FAQ: частые вопросы по мини‑ЦОД на 3–5 серверов

Ниже — типовые вопросы, которые IT‑директора и руководители инфраструктуры задают при запуске мини‑дата‑центра на 3–5 серверах в российских условиях.

Начинать с 3 серверов или сразу строить кластер из 5 узлов?

Для компаний до ~100 сотрудников чаще достаточно 3 узлов (2 вычислительных + 1 хранилище) с заранее зарезервированным местом под четвёртый сервер. При росте до 150+ сотрудников и расширении перечня систем разумнее сразу планировать 5 узлов, чтобы не переделывать архитектуру. Отталкивайтесь от пиковых нагрузок и закладывайте запас примерно 1,5× от текущих потребностей.

Что выбрать в дата‑центр: Supermicro или Dell/HPE?

Supermicro даёт лучшую плотность и гибкость конфигураций, часто с меньшим TCO на 15–20%, но требует более опытной команды. Dell и HPE удобнее в управлении (iDRAC/iLO, понятные сервисные контракты) и хорошо подходят, если в штате нет сильной команды по железу. На практике часто выбирают гибрид: вычисления на Supermicro, хранилище и критичные сервисы на Dell/HPE с NBD‑поддержкой.

Как добиться почти “нулевого” простоя при расширении с 3 до 5 серверов?

Ключ — использовать кластер виртуализации (Proxmox/VMware) с live‑миграцией и общим хранилищем LUN. Новые узлы вводятся в кластер, нагрузка переносится на них в рабочее время или в “тихие” окна, а старые ресурсы освобождаются поэтапно. При грамотной схеме вычислительные ресурсы можно наращивать без простоя бизнес‑систем, ограничиваясь ночными окнами только для обновлений.

Как обеспечить совместимость с Alt Linux и снизить лицензионные риски Microsoft?

Прежде чем закупать лицензии Windows Server и CAL, имеет смысл развернуть стенд с Proxmox или другим гипервизором и Alt Linux в качестве гостевой ОС для части сервисов. На стенде проверяются драйверы, производительность и корректная работа критичных приложений. Если Alt Linux покрывает значимую часть сценариев, можно уменьшить количество Windows‑VM и заметно снизить лицензионную нагрузку.

Как сформировать трёхлетний бюджет с учётом санкций и запасных частей?

Удобно разделить бюджет на три части: закупка (разово), электроэнергия и сервис/запчасти. На обслуживание и запасные компоненты стоит закладывать около 10–15% от стоимости оборудования в год, плюс резерв под рост тарифов на электричество. В контракте с поставщиком важно зафиксировать SLA по поставке запасных частей минимум на 3 года и объём локального склада.

Получить индивидуальное предложение по архитектуре мини‑дата‑центра

Как спроектировать мини‑дата‑центр из 3–5 серверов для средней компании в России

Как средней российской компании построить мини‑дата‑центр на 3–5 серверах

Определяем роли серверов и нагрузку

Рекомендуемые конфигурации серверов и бренды

Архитектура хранения и резервного копирования

Сетевая архитектура и высокая доступность

Типовые ошибки и расчёт TCO на 3 года

FAQ: частые вопросы по мини‑ЦОД на 3–5 серверов

Как выбрать оптические модули и кабели для 10/25/40/100G в сети дата‑центра

«Не каждую нагрузку стоит сажать на флагман»: как российскому бизнесу выстроить многоуровневую серверную архитектуру

Контактная информация

Получайте отраслевую аналитику , обновления продуктов и эксклюзивные предложения — прямо на свой почтовый ящик

Как спроектировать мини‑дата‑центр из 3–5 серверов для средней компании в России

Как средней российской компании построить мини‑дата‑центр на 3–5 серверах

Определяем роли серверов и нагрузку

Рекомендуемые конфигурации серверов и бренды

Архитектура хранения и резервного копирования

Сетевая архитектура и высокая доступность

Типовые ошибки и расчёт TCO на 3 года

FAQ: частые вопросы по мини‑ЦОД на 3–5 серверов

Как выбрать оптические модули и кабели для 10/25/40/100G в сети дата‑центра

«Не каждую нагрузку стоит сажать на флагман»: как российскому бизнесу выстроить многоуровневую серверную архитектуру

Related Posts

Где арендовать GPU-серверы дешевле и выгоднее: сравнение рынка 2025

Как выбрать оптические модули и кабели для 10/25/40/100G в сети дата‑центра

100% совместимость с Альт Рабочей станцией: готовые решения Elishtech в условиях санкций

Контактная информация