ManTech Continuous Cluster Server

MCCS는 물리적 환경, 가상환경 및 혼합환경의 Windows 와 Linux 플랫폼에 대한 미션 / 비지니스크리티컬한 애플리케이션의 고가용 및 재해복구를 지원 합니다.
OVERVIEW
OVERVIEW
btn01
오늘날 미션 / 비즈니스 크리티컬한 환경에서 애플리케이션 서비스는 중단 없이 운영되어야 합니다.
즉, 장애로 인한 서비스 다운 타임은 비즈니스 손실로 연결되며, 더 이상 허용되어서는 안됩니다. 맨텍의 MCCS는 서버, 애플리케이션 서비스, 네트워크, 스토리지 뿐만 아니라 시스템 리소스와 애플리케이션 리소스 문제로 인한 장애에 대해서 서비스 연속성을 보장하고 가용성을 극대화 할 수 있는 솔루션 입니다. MCCS는 자동 장애처리 및 실시간 데이터 복제를 통해서 미션 / 비즈니스 크리티컬한 애플리케이션을 24 x 7 / 365일 운영 할 수 있도록 합니다. 또한 중요한 이벤트 발생시 SMS 알람을 통해 장애에 대한 전파 및 후속조치를 신속히 수행할 수 있습니다.
Server Clustering
서버 클러스터링
MCCS는 서버 하드웨어, 소프트웨어, 네트워크, 스토리지 등 장애 유형에 관계없이 모든 애플리케이션을 24 x 7 x 365일 운영 할 수 있습니다. MCCS는 모든 애플리케이션의 유형에 대해서 보호가 가능하며, 서버 클러스터링을 통해 다운타임을 수분에서 수초로 최소화 합니다.
Real-time block replication
실시간 블록 복제
블록 레벨 복제로 타켓과 소스의 데이터 정합성 보장 합니다. 두 서버 사이에 데이터 복제 모듈이 구성 되면, 소스볼륨에 쓰기 작업이 발생 시 TCP/IP 네트워크를 통해서 타겟 볼륨에 동시에 쓰기 작업을 수행하게 됩니다. MCCS는 모든 종류의 파일과 데이터베이스를 지원하며, 장애 및 재해에 대해서 중요한 데이터가 손실되지 않습니다.
Global dashboard
통합 가용성 관리
맨텍의 클라우드 기반의 글로벌 관리 센터를 통해 여러 분산된 클러스터를 한 눈으로 관리할 수 있습니다. 또한 가용성 보고서를 통해 가용성 관련한 통계정보를 직관적으로 볼 수 있습니다.
FEATURES
FEATURES
주요기능
– Wizard 방식으로 쉽게 설치 및 HA 구성 가능
– 서버, 네트워크, 스토리지, 소프트웨어 및 관련 자원의 자동 장애감지 및 서비스 복구
– 복잡한 스크립트 없이 손쉬운 마우스 드래그로 자원간 의존성 설정
– 대부분의 소프트웨어, 서비스, 사용 정의 프로세스, 배치 스크립트를 지원
– 가상 IP 및 호스트 네임 페일오버 제공
– 공유스토리지 환경에서 split brain 방지를 위해 I/O fencing 제공.
– PCI-e 기반의 낸드 플래시, SAN, iSCSI,NAS 등 다양한 스토리지 환경 지원
– 블록레벨의 실시간 데이터 복제 제공 (Sync, Async, Semi-Async)
– 데이터 복제 거리제한 없음
– 물리서버 대 물리서버, 물리서버 대 가상서버, 가상서버 대 가상서버 간의 HA/DR 지원
– 웹 콘솔을 통한 손쉬운 관리.
– 중요 이벤트에 대한 장애 알람 모바일 전송 (클라우드 서비스 기반)
– 고가용 보고서 제공.(클라우드 서비스 기반)
제공 이점
-서버 하드웨어, 소프트웨어, 네트워크, 스토리지 장애 포인트 제거
– RPO≥0, RTO>min 구현
– HA/DR을 구성하기 위하여 추가 하드웨어, 스토리지, 애플리케이션을 수정할 필요가 없음
– 다운타임 최소화를 통한 생산성 증대
– SANless HA/DR을 통한 최소한의 비용으로 서버 및 데이터 이중화
– 운영이 복잡 하지 않아 HA/DR을 유지하기 위한 담당자의 업무를 줄일 수 있음
REQUIREMENT
SYSTEM REQUIREMENT
지원 운영체제
– Windows 7 / 8 / 10 (Progessional, Enterprise, Ultimate Edition)
– Windows 2008 /R2 Server and higher edition (Foundatin, HPC, Web Edition Not Support)
– Windows 2012 /R2 Server and higher edition (Foundation Edition Not Support)
– Redhat Linux 5 Update 6 and higher
– Cent OS Linux 5 and higher
– Cent OS Linux 5 Update 6 and higher
– Oracle Enterprise Linux 7 and higher (Support both Redhat Compatible Kernel and Unbreakable Enterprise Kernel)
– SUSE Enterprise Linux 12 and up to 12 SP2
– IBM PowerLinux 7 and up to 7 update 3
지원 스토리지
– PCI-e type nand flash disk
– Internal SAS and SATA
– External DAS, SAN, iSCSI, NAS
지원 가상화 플랫폼
– Vmware vSphere
– Xen Server – MS-HyperV
– Redhat Enterprise Virtualization
FAQ

1. MCCS의 장애감지 범위는 어떻게 됩니까?

MCCS는 정상적인 서비스의 중단에 영향을 끼칠 수 있는 요소들을 감지하고 자동으로 복구하는 것이 주 목적입니다.

따라서 이를 위해 네트워크 접속가능성, 응용프로그램의 정상 작동 여부, 스토리지의 접근가능성, OS의 정상적인 운영상태 등의 요소를 감시합니다.

2. ‘리소스’는 무엇입니까?

리소스는 MCCS에서 정상상태의 감시대상이 되는 요소를 지칭합니다.

MCCS는 크게 다음의 카테고리로 리소스를 관리합니다.

-IP Address : 사용자가 서버에 접속할 IP주소이며, MCCS상에서 가상 IP를 추가할 수 있습니다.

-Virtual Name : 사용자가 서버에 접속할 name이며, MCCS상에서 가상 name을 추가할 수 있습니다.

-Network Interface Card : 사용자가 접속할 가상 IP를 할당할 이더넷 카드입니다.

-Disk : 사용자의 애플리케이션이나 데이터가 저장될 스토리지 볼륨이며, MCCS에서는 공유 스토리지와 실시간 복제를 위한 미러 디스크 두 가지를 관리할 수 있습니다.

-Windows Service : Windows OS의 service registry에 등록되는 서비스이며, 이에 대한 장애 감시가 가능합니다.

-Process : Windows OS의 경우 .exe나 .com같은 실행 프로그램입니다.

-Application : 여러 프로세스와 service가 복합적으로 어우러진 프로그램 집합체 입니다.

3. ‘그룹’은 무엇입니까?

그룹은 리소스가 집합이 되어 응용프로그램의 서비스를 제공하는 단위입니다.

예를 들어 데이터베이스 서비스를 서버에서 운영한다고 가정한다면, 이를 위해서 다수의 service와 process 리소스가 구동될 것입니다. 또한 클라이언트의 접속을 위해서 IP 주소가 필요하고 IP 주소를 할당할 이더넷 카드가 필요합니다.

마지막으로 데이터베이스를 저장할 스토리지 볼륨이 필요합니다. 이러한 리소스들이 집합되어 정상적인 구동이 되어야  온전한 데이터베이스 서비스가 가능해집니다. 이를 MCCS상에서는 그룹이라 부르고 그룹 내의 어떤 리소스가 장애 발생하면 그룹 전체를 대기서버로 페일오버(fail-over) 합니다. MCCS상에서는 하나의 클러스터에 여러 개의 그룹을 생성할 수 있습니다.

4. 통상적으로 페일오버(fail-over) 시간은 얼마나 소요됩니까?

페일오버 시간은 애플리케이션이나 환경에 따라 다릅니다. 통상적으로 페일오버 시간은 장애감지시간, 장애이후 페일오버를 결정하는 시간, 페일오버 시 대기서버에서 응용프로그램을 포함한 리소스들이 구동되는 시간들의 합산입니다. MCCS상에서 장애감지와 페일오버 결정은 수초 이내에 이루어 집니다. 하지만 변수는 애플리케이션과 리소스들이 구동되는 수와 시간입니다. 이 변수에 따라 페일오버 시간은 크게 차이가 날 수 있습니다. 따라서 정확한 페일오버 소요시간을 정의하는 것은 대략, 수십 초에서 수십 분 정도 소요될 수 있습니다.

5. MCCS의 구성을 위해서 별도의 외장 스토리지, Active directory 환경 및 witness server 등의 별도 환경이 필요합니까?

MCCS는 추가적인 스토리지나 Active directory, witness server 등의 구성 없이도 HA구성이 가능합니다. 단 클러스터 노드간 heartbeat 통신을 위한 추가적인 이더넷 포트와 서버간 실시간 복제 구성일 경우 데이터 복제를 위한 추가적인 이더넷 포트만 구비되면 됩니다.

6. 장애로 인해서 페일오버가 되면 대기서버의 IP주소와 hostname이 다른데, 이때 클라이언트 쪽의 접속 경로 수정이 필요합니까?

아니요. MCCS는 가상 IP와 가상 Name을 지원합니다. 따라서 클러스터를 구성할 때 기존 운영시스템과 대기시스템의 실제 IP주소 이외 가상 IP를 추가하게 되며, 클라이언트는 가상 IP로 접속합니다. 또한 가상 IP는 운영시스템에 할당되며 장애 시 MCCS는 대기서버에서 해당 가상 IP를 자동으로 할당해줌으로써 클라이언트의 접속경로 수정없이 기존 환경으로 접속이 가능합니다.

7. MCCS에서 제공하는 데이터복제는 실시간 입니까?

MCCS는 블록레벨의 복제를 제공하며 쓰기 I/O에 대해서 변경된 블록을 실시간으로 TCP/IP네트워크를 통해 대기서버로 전송합니다.

8. 데이터 복제 방식은 동기식입니까? 비동기식 입니까?

MCCS는 동기식과 비동기식을 모두 지원합니다. 각 복제를 하고자 하는 볼륨이나 드라이브 레터별로 방식을 설정할 수 있으며, 데이터 일치성, 복제 네트워크의 속도, 성능 영향도 등을 고려하여 적합한 모드를 선택하면 됩니다.

9. 실시간 복제의 데이터베이스의 호환성은 어떠합니까?

MCCS의 블록레벨 복제는 커널드라이브 레벨에서 해당 볼륨의 변경된 블록을 캡처하여 전송합니다. 따라서 상단위 화일, 데이터베이스 등의 종류에 관계없이 지원이 가능하며 Raw device에 대한 복제도 가능합니다.

10. 동기방식 복제의 경우 전송네트워크의 장애나 타겟 시스템의 장애 시 운영시스템 또한 쓰기작업을 수행하지 못하는 경우가 발생할 수 있습니까?

일반적으로 동기식 복제모드는 타겟에서 변경된 블록을 전송 받아 쓰기작업이 준비가 되면 운영시스템도 쓰기작업을 같이 수행합니다. 따라서 복제 전송네트워크 혹은 타겟 시스템 장애 시 운영시스템도 쓰기작업을 수행하지 못할 것이라는 우려가 있습니다. MCCS는 전송네트워크나 타겟 시스템의 장애를 감지하며, 복제상태를 일시중지 상태로 전환시키고 타겟 시스템 상관없이 운영시스템에 대해서 쓰기작업을 수행합니다. 이때 변경된 블록은 전송할 수 없는 상태이며, 해당 블록에 대해서는 dirty bit값을 표시합니다.

11. 데이터 복제의 거리제한이 있습니까?

TCP/IP기반으로 복제를 하기 때문에 거리제한이 없습니다.

12. 복제 네트워크의 장애이후 복제가 중지되었다가 네트워크가 재개되면 다시 관리자가 데이터 재동기를 해줘야 합니까?

네트워크 재개시 복제모드는 재동기모드로 바뀌게 되고 이때 MCCS는 dirty bit가 찍힌 블록을 읽어 들여 자동으로 타겟 시스템으로 전송합니다. 따라서 관리자가 수작업으로 재동기를 할 필요가 없습니다.