close
logo

Как ITGLOBAL.COM развернул Stretched Cluster vStack HCP на серверах ITPOD

Кейсы

В ITGLOBAL.COM развернули Stretched Cluster на платформе vStack HCP на серверах ITPOD, два дата‑центра объединили в единую инфраструктуру, которая выдерживает отказ площадки и продолжает обслуживать бизнес‑сервисы.

ITPOD - ведущий российский производитель серверов, систем хранения данных и сетевого оборудования для корпоративного и дата-центрового сегмента. Оборудование ITPOD обеспечивает производительность и надежность, сопоставимую с западными аналогами, и также протестировано в составе платформы виртуализации vStack HCP.

ITPOD создает решения, на которые можно положиться в любой корпоративной инфраструктуре:

  • Широкий выбор конфигураций - от серверов на базе Intel Scalable Gen3 с SATA SSD до высокопроизводительных решений на Intel Xeon 6 с NVMe SSD. Это позволяет подобрать оптимальную платформу под любые бизнес-задачи
  • Единая точка поддержки - только быстрое решение любых вопросов на всех уровнях инфраструктуры от «железа» до ПО vStack.
  • Предсказуемость и надежность - отработанные сценарии отказоустойчивости и комплексное нагрузочное тестирование гарантируют бесперебойную работу критически важных сервисов.

С ITPOD компании получают полный стек аппаратной инфраструктуры, способный масштабироваться и адаптироваться под любые бизнес‑требования, без компромиссов по качеству или безопасности.

Концепция Stretched Cluster vStack

Stretched Cluster в vStack HCP объединяет две географически разнесенные площадки в единый логический кластер. Данные виртуальных машин синхронно реплицируются между площадками, что обеспечивает их сохранность при отказе одной из сторон.

vStack — российский разработчик платформы для построения отказоустойчивой ИТ-инфраструктуры и виртуальных дата-центров. Решение позволяет развернуть управляемый виртуальный дата-центр на стандартном оборудовании с высокой производительностью, низкими издержками (CPU overhead 2-5%) и централизованным управлением через единый API и веб-интерфейс.

Для поддержания согласованного состояния используется внешний quorum-сервер, размещенный на третьей площадке, который предотвращает split-brain и обеспечивает корректную работу кластера в аварийных сценариях. При отказах или проведении плановых работ виртуальные машины автоматически перезапускаются на доступной площадке.

Для заказчиков доступна бесплатная опция quorum‑сервера как сервиса. Развернем виртуальную машину под внешний quorum‑сервер в нашем облаке и возьмём её обслуживание на себя.

Возможность предоставляется в рамках акции для проектов со stretched-кластером vStack, реализуемых в 2026 году.

Конфигурация серверов ITPOD

Stretched Cluster развернут между двумя географически разнесенными ЦОДами - DataSpace (ул. Шарикоподшипниковская, 11) и IXcellerate Moscow South (ул. Подольских Курсантов, 15Б). Для автоматического переключения между площадками задействован арбитр Witness на третьей площадке в ЦОД M9.

Между дата‑центрами проложены два независимых канала «темной оптики» по разным трассам длиной 26 и 38 км. По ним осуществляется Cluster Interconnect и синхронная репликация данных. Суммарная пропускная способность между плечами кластера (ЦОД IX и DS1) составляет 20 Gbps с возможностью масштабирования до 50 Gbps.

В каждом ЦОДе установлено по три сервера ITPOD-SL201-D25RE.

Модель сервера: ITPOD-SL201-D25RE

Конфигурация сервера:

  • 2 x Intel Xeon Gold 6226R;
  • 24 x 64GB RDIMM 3200MHz;
  • 1 x LSI HBA 9400-16i;
  • 6 x 3.84TB SSD SAS (Samsung PM1643a);
  • 2 x 480GB SSD SATA (Samsung PM893);
  • 1 x 2-port 10Gb Eth SFP+ (Intel 82599);
  • 1 x 2-port 25Gb Eth SFP28 (Mellanox CX-5);
  • 2 x 1300W AC PSU.

Каждый сервер ITPOD-SL201-D25RE оснащён двумя процессорами Intel Xeon Gold 6226R и 1,5 ТБ DDR4. А легковесный гипервизор vStack на практике позволяет эффективно работать с переподпиской до 9:1. В результате 32 физических ядра могут предоставить до 288 vCPU, что подтверждено реальной эксплуатацией и дает высокий запас для плотного размещения ВМ и сервисов платформы.

Слой SDS реализован на SAS HBA-контроллерах без аппаратного RAID. Это позволяет vStack напрямую управлять дисками и гибко распределять нагрузку.

Для хранения данных используются SAS SSD Samsung PM1643a объёмом 3,84 ТБ, рассчитанные на постоянную интенсивную работу. В SDS-слое хранения виртуальных машин, построенном на связке комбо SAS HBA и SAS SSD Samsung, применяется inline-дедупликация и компрессия. Обработка выполняется непосредственно на SSD, что позволяет увеличить эффективный объем доступного пространства до трёх раз без заметного влияния на отклик системы.

Сетевая подсистема построена на Ethernet-адаптерах 10 и 25 GbE и обеспечивает раздельную работу клиентских сетей и межузлового interconnect-трафика. Платформа vStack HCP использует стандартные Ethernet-сети и не требует выделенных FC-фабрик для синхронизации площадок, что упрощает архитектуру и снижает требования к инфраструктуре. Высокая пропускная способность и значения PPS позволяют стабильно обслуживать как репликацию данных, так и внешние подключения без взаимного влияния.

Тестирование производительности и отказоустойчивости

Нагрузочные тесты

Перед вводом кластера в эксплуатацию инженеры ITGLOBAL.COM выполнили серию нагрузочных тестов внутри виртуальных машин для оценки производительности платформы. Нагрузку на процессор и память оценивали с помощью sysbench cpu и sysbench memory с объемом теста 40 ГБ, а дисковую подсистему проверяли утилитой fio с профилем 4K randrw.

Таблица 1 - Чтение (Read)

МетрикаServer
IOPS50.9k
Пропускная способность199 MiB/s (209 MB/s)
Объем данных11.7 GiB (12.5 GB)
Средняя латентность чтения (мкс)37.04

Таблица 2 — Запись (Write)

МетрикаServer
IOPS50.9k
Пропускная способность199 MiB/s (208 MB/s)
Объем данных11.6 GiB (12.5 GB)
Средняя латентность записи (мкс)38.06

Прикладное тестирование

После синтетических нагрузок кластер перешёл к прикладному тестированию, в рамках которого проверялась отказоустойчивость инфраструктуры при работе бизнес-приложения SimpleOne — российской ESM-платформы для автоматизации IT- и бизнес-процессов.


SimpleOne - российская ESM-платформа для автоматизации IT- и бизнес-процессов. Система объединяет Service Desk, управление проектами, активами и заявками в единой среде с low-code возможностями. На платформе также доступны готовые модули для управления разработкой (SDLC), работы с корпоративными клиентами (B2B CRM) и HR-процессами (HRMS). Архитектура предусматривает использование AI-инструментов для интеллектуальной автоматизации процессов.

Платформа работает на базе PostgreSQL, создавая смешанную нагрузку на вычислительные ресурсы и дисковую подсистему - идеальный кандидат для тестирования отказоустойчивости виртуальной инфраструктуры в условиях, максимально приближенных к продуктивной эксплуатации.
 

Тип нагрузки

В качестве базового сценария применялся профиль load, моделирующий одновременную работу более 100 пользователей со смешанной активностью чтения и записи. Такой режим позволял оценить поведение связки SimpleOne + vStack HCP в условиях, близких к реальной эксплуатации, включая влияние инфраструктурных отказов на работу приложения.

Сценарии отказов

Проверка отказоустойчивости проводилась под активной прикладной нагрузкой. В рамках тестирования отказоустойчивости были отработаны следующие сценарии:

  • полное отключение питания на одной из площадок;
  • потеря внутренних сетевых интерфейсов узлов (NIC failover);
  • остановка BGP-анонса внешней сети;
  • разрыв межплощадочного interconnect-канала.

Для каждого сценария фиксировались фактические значения RTO и поведение виртуальных машин.

Рисунок - Тестируемая архитектуры кластера с межплощадочным соединением и сетевой связностью

Результаты тестирования отказоустойчивости

При отказе одной из площадок виртуальные машины автоматически запускались на доступной стороне с кратковременной паузой.

При разрыве межплощадочного канала кворум-сервер фиксировал единственную активную сторону, а виртуальные машины на второй площадке корректно останавливались, исключая рассинхронизацию данных.

Для внешних подключений использовался BGP Anycast, поэтому клиенты продолжали обращаться к тому же пулу IP-адресов даже при частичной недоступности инфраструктуры. Кластер корректно отрабатывал отказные ситуации в рамках проектных требований.

Результаты внедрения

Растянутый кластер на базе серверов ITPOD и платформы vStack HCP гарантирует непрерывность критичных сервисов без зависимости от зарубежных технологий, обеспечивая RPO=0, RTO<45 секунд и DTO=0. 

В реальных тестах с бизнес-приложением SimpleOne ITSM под смешанной нагрузкой (2500+ запросов/мин) инфраструктура пережила полное отключение питания площадки, разрыв 100G interconnect-канала, потерю BGP-анонса и сбой сетевых интерфейсов - клиенты продолжали работу по тем же IP-адресам благодаря BGP Anycast, а виртуальные машины автоматически перезапускались на здоровой площадке за 45 секунд.

Поведение системы оставалось предсказуемым: интерфейс не деградировал, пользовательские сессии не прерывались, транзакции не терялись даже при пиковых нагрузках свыше 100 пользователей.

Такая модель работы позволяет бизнесу тиражировать двухплощадочные архитектуры в частных облаках и корпоративных ЦОД, позволяя снижать риск простоя до уровней, соответствующих требованиям enterprise-SLA.

ITPOD усиливает экосистему готовыми конфигурациями серверов и СХД под vStack Stretched Cluster. Это не просто железо, а проверенная на краш-тестах инфраструктура с  технической поддержкой из России, где каждый сбой заранее смоделирован и задокументирован.

Оцените данную статью