Отказоустойчивый центр обработки данных

Решаемые задачи
Обеспечение работоспособности комплекса обработки данных в случае выхода из строя какого-либо компонента по причине отказа оборудования.

Потребители
Финансовые структуры, транспортно-складские организации, статистические центры, медицинские учреждения.

Аппаратная платформа
● сервера: RISC сервера HP (AlphaServer, Integrity), IBM (POWER5), Fujitsu-Siemens (PrimePower)
● система хранения данных (СХД): совместимые с перечисленными серверами и ОС (HP, IBM, EMC, HDS)
● сетевая инфраструктура и SAN: HP, IBM, Cisco Systems, McData, Brocade
● источники бесперебойного питания: APC

Программная платформа
ОС OpenVMS (AlphaServer, Integrity), HP-UX Mission Critical Operating Environment (HP9000, Integrity), AIX5L HACMP (POWER5), Solaris PRIMECLUSTER, Oracle Real Application Cluster.

Функциональные возможности
В случае, когда большая удаленность узлов кластера катастрофоустойчивого решения не является необходимым требованием, но при этом требуется обеспечить бесперебойное выполнение некоторого круга задач, строится отказоустойчивый центр обработки данных. Основным условием является отсутствие единой точки отказа.

Для удовлетворения этих требований используются локальные кластеры. Как правило, это несколько серверов и систем хранения данных, имеющих дублирование жизненно важных рабочих компонентов, таких как блоки питания, сетевые и дисковые контроллеры, пути доступа к данным.
Структурно центр обработки данных представляет собой сеть серверов и СХД, объединенных в единый кластер высокой доступности. Сервера и СХД в данном решении располагаются в одном месте. Доступность данных обеспечивается резервированием всех компонентов комплекса, включая линии передачи данных и силовые линии.

Эффект от внедрения
● обеспечение надежности хранения критически важной информации, минимизация потери данных при возникновении сбоев в системе
● повышение качества работы сотрудников за счет уменьшения времени доступа к информации и обработки данных центра
● получение возможности проведения планового обслуживания и модернизации системы без остановки работы пользователей

Пример

Необходимо обеспечить бесперебойную работу по обслуживанию грузоперевозок. Основным компонентом системы является БД Oracle. Все оборудование размещается в шкафах в одном помещении. Здание оборудовано системой бесперебойного питания. Для работы с СУБД Oracle предлагается использовать три сервера IBM p520 под управлением ОС AIX 5L и программы кластеризации HACMP, две системы хранения EMC CLARiiON CX500, инфраструктуры SAN на базе двух Fiber Channel коммутаторов (FC-SW) Cisco MDS 9216, а также системы резервного копирования IBM TotalStorage Ultrium Tape 2U Autoloader 3581. Каждый сервер имеет два адаптера Fiber Channel FC-HBA для обеспечения доступа к FC-SW по нескольким путям, два встроенных 10/100/1000 Ethernet порта для работы в локальной сети (LAN) и сетевой контроллер (NIC) с двумя портами 10/100/1000 Ethernet для работы служб Oracle Real Application Cluster.

Системы хранения данных EMC CLARiiON CX500 обеспечивают хранение и совместное использование данных СУБД Oracle. Для обеспечения высокой отказоустойчивости на них устанавливается ПО EMC MirrorView для синхронизации данных между системами, используя возможности контроллера, и EMC SnapView для улучшения условий архивирования и восстановления данных. Серверы и системы хранения работают в сети хранения данных (SAN), основу которой составляют 16-ти портовые коммутаторы Cisco MDS 9216. Пара коммутаторов образует отказоустойчивую среду передачи данных с двумя возможными путями передачи. Система архивирования состоит из автозагрузчика IBM Ultrium Tape Autoloader 3581 с приводом LTO-2, подключенного к сети SAN. Управление автозагрузчиком может осуществляться с любого из серверов. Работоспособность системы достигается отсутствием единой точки отказа путем резервирования ее компонентов. Обмен информацией происходит по нескольким путям, подвод электропитания производится от разных источников через ИБП с фиксированным временем аварийной работы.

Выход из строя любого узла системы компенсируется распределением нагрузки на оставшиеся в работе компоненты. Нагрузка распределяется либо средствами ОС (OpenVMS, HACMP, PRIMECLUSTER), либо средствами приложений (Oracle RAC). Задачи синхронизации данных между СХД решаются либо средствами ОС (Volume Shadowing), либо на уровне контроллеров СХД (Business Copy, Continue Access, FlashCopy и др.). Для задач резервного копирования используются либо ленточные библиотеки (для долгосрочного хранения копий), либо недорогие системы на SATA-дисках.

Добавить комментарий

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.