Как ITGLOBAL.COM развернул Stretched Cluster vStack HCP на серверах ITPOD
В ITGLOBAL.COM развернули Stretched Cluster на платформе vStack HCP на серверах ITPOD, два дата‑центра объединили в единую инфраструктуру, которая выдерживает отказ площадки и продолжает обслуживать бизнес‑сервисы.
ITPOD - ведущий российский производитель серверов, систем хранения данных и сетевого оборудования для корпоративного и дата-центрового сегмента. Оборудование ITPOD обеспечивает производительность и надежность, сопоставимую с западными аналогами, и также протестировано в составе платформы виртуализации vStack HCP.
ITPOD создает решения, на которые можно положиться в любой корпоративной инфраструктуре:
- Широкий выбор конфигураций - от серверов на базе Intel Scalable Gen3 с SATA SSD до высокопроизводительных решений на Intel Xeon 6 с NVMe SSD. Это позволяет подобрать оптимальную платформу под любые бизнес-задачи
- Единая точка поддержки - только быстрое решение любых вопросов на всех уровнях инфраструктуры от «железа» до ПО vStack.
- Предсказуемость и надежность - отработанные сценарии отказоустойчивости и комплексное нагрузочное тестирование гарантируют бесперебойную работу критически важных сервисов.
С ITPOD компании получают полный стек аппаратной инфраструктуры, способный масштабироваться и адаптироваться под любые бизнес‑требования, без компромиссов по качеству или безопасности.
Концепция Stretched Cluster vStack
Stretched Cluster в vStack HCP объединяет две географически разнесенные площадки в единый логический кластер. Данные виртуальных машин синхронно реплицируются между площадками, что обеспечивает их сохранность при отказе одной из сторон.
vStack — российский разработчик платформы для построения отказоустойчивой ИТ-инфраструктуры и виртуальных дата-центров. Решение позволяет развернуть управляемый виртуальный дата-центр на стандартном оборудовании с высокой производительностью, низкими издержками (CPU overhead 2-5%) и централизованным управлением через единый API и веб-интерфейс.
Для поддержания согласованного состояния используется внешний quorum-сервер, размещенный на третьей площадке, который предотвращает split-brain и обеспечивает корректную работу кластера в аварийных сценариях. При отказах или проведении плановых работ виртуальные машины автоматически перезапускаются на доступной площадке.
Для заказчиков доступна бесплатная опция quorum‑сервера как сервиса. Развернем виртуальную машину под внешний quorum‑сервер в нашем облаке и возьмём её обслуживание на себя.
Возможность предоставляется в рамках акции для проектов со stretched-кластером vStack, реализуемых в 2026 году.
Конфигурация серверов ITPOD
Stretched Cluster развернут между двумя географически разнесенными ЦОДами - DataSpace (ул. Шарикоподшипниковская, 11) и IXcellerate Moscow South (ул. Подольских Курсантов, 15Б). Для автоматического переключения между площадками задействован арбитр Witness на третьей площадке в ЦОД M9.
Между дата‑центрами проложены два независимых канала «темной оптики» по разным трассам длиной 26 и 38 км. По ним осуществляется Cluster Interconnect и синхронная репликация данных. Суммарная пропускная способность между плечами кластера (ЦОД IX и DS1) составляет 20 Gbps с возможностью масштабирования до 50 Gbps.
В каждом ЦОДе установлено по три сервера ITPOD-SL201-D25RE.
Модель сервера: ITPOD-SL201-D25RE
Конфигурация сервера:
- 2 x Intel Xeon Gold 6226R;
- 24 x 64GB RDIMM 3200MHz;
- 1 x LSI HBA 9400-16i;
- 6 x 3.84TB SSD SAS (Samsung PM1643a);
- 2 x 480GB SSD SATA (Samsung PM893);
- 1 x 2-port 10Gb Eth SFP+ (Intel 82599);
- 1 x 2-port 25Gb Eth SFP28 (Mellanox CX-5);
- 2 x 1300W AC PSU.
Каждый сервер ITPOD-SL201-D25RE оснащён двумя процессорами Intel Xeon Gold 6226R и 1,5 ТБ DDR4. А легковесный гипервизор vStack на практике позволяет эффективно работать с переподпиской до 9:1. В результате 32 физических ядра могут предоставить до 288 vCPU, что подтверждено реальной эксплуатацией и дает высокий запас для плотного размещения ВМ и сервисов платформы.
Слой SDS реализован на SAS HBA-контроллерах без аппаратного RAID. Это позволяет vStack напрямую управлять дисками и гибко распределять нагрузку.
Для хранения данных используются SAS SSD Samsung PM1643a объёмом 3,84 ТБ, рассчитанные на постоянную интенсивную работу. В SDS-слое хранения виртуальных машин, построенном на связке комбо SAS HBA и SAS SSD Samsung, применяется inline-дедупликация и компрессия. Обработка выполняется непосредственно на SSD, что позволяет увеличить эффективный объем доступного пространства до трёх раз без заметного влияния на отклик системы.
Сетевая подсистема построена на Ethernet-адаптерах 10 и 25 GbE и обеспечивает раздельную работу клиентских сетей и межузлового interconnect-трафика. Платформа vStack HCP использует стандартные Ethernet-сети и не требует выделенных FC-фабрик для синхронизации площадок, что упрощает архитектуру и снижает требования к инфраструктуре. Высокая пропускная способность и значения PPS позволяют стабильно обслуживать как репликацию данных, так и внешние подключения без взаимного влияния.
Тестирование производительности и отказоустойчивости
Нагрузочные тесты
Перед вводом кластера в эксплуатацию инженеры ITGLOBAL.COM выполнили серию нагрузочных тестов внутри виртуальных машин для оценки производительности платформы. Нагрузку на процессор и память оценивали с помощью sysbench cpu и sysbench memory с объемом теста 40 ГБ, а дисковую подсистему проверяли утилитой fio с профилем 4K randrw.
Таблица 1 - Чтение (Read)
| Метрика | Server |
| IOPS | 50.9k |
| Пропускная способность | 199 MiB/s (209 MB/s) |
| Объем данных | 11.7 GiB (12.5 GB) |
| Средняя латентность чтения (мкс) | 37.04 |
Таблица 2 — Запись (Write)
| Метрика | Server |
| IOPS | 50.9k |
| Пропускная способность | 199 MiB/s (208 MB/s) |
| Объем данных | 11.6 GiB (12.5 GB) |
| Средняя латентность записи (мкс) | 38.06 |
Прикладное тестирование
После синтетических нагрузок кластер перешёл к прикладному тестированию, в рамках которого проверялась отказоустойчивость инфраструктуры при работе бизнес-приложения SimpleOne — российской ESM-платформы для автоматизации IT- и бизнес-процессов.
SimpleOne - российская ESM-платформа для автоматизации IT- и бизнес-процессов. Система объединяет Service Desk, управление проектами, активами и заявками в единой среде с low-code возможностями. На платформе также доступны готовые модули для управления разработкой (SDLC), работы с корпоративными клиентами (B2B CRM) и HR-процессами (HRMS). Архитектура предусматривает использование AI-инструментов для интеллектуальной автоматизации процессов.Платформа работает на базе PostgreSQL, создавая смешанную нагрузку на вычислительные ресурсы и дисковую подсистему - идеальный кандидат для тестирования отказоустойчивости виртуальной инфраструктуры в условиях, максимально приближенных к продуктивной эксплуатации.
Тип нагрузки
В качестве базового сценария применялся профиль load, моделирующий одновременную работу более 100 пользователей со смешанной активностью чтения и записи. Такой режим позволял оценить поведение связки SimpleOne + vStack HCP в условиях, близких к реальной эксплуатации, включая влияние инфраструктурных отказов на работу приложения.
Сценарии отказов
Проверка отказоустойчивости проводилась под активной прикладной нагрузкой. В рамках тестирования отказоустойчивости были отработаны следующие сценарии:
- полное отключение питания на одной из площадок;
- потеря внутренних сетевых интерфейсов узлов (NIC failover);
- остановка BGP-анонса внешней сети;
- разрыв межплощадочного interconnect-канала.
Для каждого сценария фиксировались фактические значения RTO и поведение виртуальных машин.
Рисунок - Тестируемая архитектуры кластера с межплощадочным соединением и сетевой связностью
Результаты тестирования отказоустойчивости
При отказе одной из площадок виртуальные машины автоматически запускались на доступной стороне с кратковременной паузой.
При разрыве межплощадочного канала кворум-сервер фиксировал единственную активную сторону, а виртуальные машины на второй площадке корректно останавливались, исключая рассинхронизацию данных.
Для внешних подключений использовался BGP Anycast, поэтому клиенты продолжали обращаться к тому же пулу IP-адресов даже при частичной недоступности инфраструктуры. Кластер корректно отрабатывал отказные ситуации в рамках проектных требований.
Результаты внедрения
Растянутый кластер на базе серверов ITPOD и платформы vStack HCP гарантирует непрерывность критичных сервисов без зависимости от зарубежных технологий, обеспечивая RPO=0, RTO<45 секунд и DTO=0.
В реальных тестах с бизнес-приложением SimpleOne ITSM под смешанной нагрузкой (2500+ запросов/мин) инфраструктура пережила полное отключение питания площадки, разрыв 100G interconnect-канала, потерю BGP-анонса и сбой сетевых интерфейсов - клиенты продолжали работу по тем же IP-адресам благодаря BGP Anycast, а виртуальные машины автоматически перезапускались на здоровой площадке за 45 секунд.
Поведение системы оставалось предсказуемым: интерфейс не деградировал, пользовательские сессии не прерывались, транзакции не терялись даже при пиковых нагрузках свыше 100 пользователей.
Такая модель работы позволяет бизнесу тиражировать двухплощадочные архитектуры в частных облаках и корпоративных ЦОД, позволяя снижать риск простоя до уровней, соответствующих требованиям enterprise-SLA.
ITPOD усиливает экосистему готовыми конфигурациями серверов и СХД под vStack Stretched Cluster. Это не просто железо, а проверенная на краш-тестах инфраструктура с технической поддержкой из России, где каждый сбой заранее смоделирован и задокументирован.