Maystyle :
Admin : New post
Guestbook
Local
media
Catergories
Recent Articles
Recent Comments
Recent Trackbacks
Calendar
Tag
Archive
Link
Search
 
해당되는 게시물 3건
  MSCS 각 모듈에 대한 설명 
작성일시 : 2008.10.17 12:14 | 분류 : Windows Server/Cluster | 태그 : Checkpoint Manager, Cluster, CP, Database Manager, DM, Failover Manager, FM, Global Update Manager, gum, lm, Log Manager, Membership Manager, mm, mscs, NM, Node Manager

클러스터 로그를 보게 되면 FM, GUM 등을 확인 할 수 있습니다.
분명 특정 Role을 하는 녀석들의 통칭일껀데 도대체 이게 뭘까요?

해당 모듈명을 알게 되면 로그를 보는데도 클러스터를 이해하는대도 큰 도움이 됩니다.
본 내용을 보기 위해서는 이전 글 (http://maystyle.tistory.com/357)의 Cluster 데이터 베이스에 대한 내용을 먼저 숙지하셔야 합니다.

1, DM (Database Manager)
Cluster의 Database를 관리합니다. 특정 노드에서 Cluster 구성 정보가 변경되게 되면 DM은 Cluster 구성 정보를 로컬의 레지스트리에 저장합니다.

2. LM (Log Manager)
변경 정보를 쿼럼 디스크에 반영하며 클러스터의 구성 정보를 최신 정보로 유지하는 책임을 지게 됩니다.

3. GUM (Global Update Manager)
변경된 구성 정보를 다른 노드에 동기화 시킵니다. Global Update는 무결성을 기반으로 합니다.
즉 Passive 된 노드에 구성 정보를 Update 할 경우 해당 노드의 Cluster Database에 대한 Update가 실패 하게 되면 Active Node 에서는 "Poison Packet"을 Passive Node에 보내 Cluster 서비스를 중지 시킵니다.

4. CP (Checkpoint Manager)
각 리소스의 레지스트리 내용 변경이 발생 할 경우 Quorum 의 registry checkpoint 파일에 저장하는 역활을 합니다.이 녀석의 역활은 꽤나 중요한데 클러스터에서 Fail over가 발생 할 경우 쿼럼에 저장된 데이터 베이스의 사본을 읽는 것이 아니라 해당 쿼럼의 Check Point 파일을 일어 데이터베이스의 내용을 최신의 정보로 유지하게 됩니다.

5. NM (Node Manager)
Heartbeat을 통해 Cluster 상의 노드의 Health를 확인 합니다.
만약 문제가 감지되게 되면 "regroup event" 를 multicast로 전송하고 response가 오는 노드만을 대상으로 클러스터 노드를 재구성합니다.
NM은 Quorum Disk Arbitration을 관리하면 Heartbeat 통신이 중단 되는 경우 Quorum을 소유한 노드로 모든 리소스를 fail over 시킵니다.

6. MM (Membership Manager)
현재 실행 중인 노드의 리스트를 관리합니다. NM에서 reqroup event 를 보내게 되면 MM은 Regroup event 응답 여부에 따라 클러스터 노드의 리스트를 재구성합니다. 문제 노드가 정상으로 동작하게 되면 MM은 해당 노드를 다시 클러스터에 추가하게 됩니다.

7. FM (Failover Manager)
리소스와 리소스 그룹의 시작과 중지를 책임 집니다.
Failover 상황에서 어느 노드에서 가상 서버가 시작될 지를 판한합니다.

출처 : Technet 세미나

  Cluster의 Disk 접근 문제 
작성일시 : 2008.10.17 11:39 | 분류 : Windows Server/Cluster | 태그 : 1034, clusdb, clussvc, Cluster, connection problem, Disk, mscs, problem, Signature

클러스터를 운영하는 중에 ClusSvc 에 1034 이벤트와 함께 DISK를 찾을 수 없다는 문제가 발생하는 경우가 있습니다.

cluster가 Disk에 접근 하기 까지는 아래와 같은 큐를 통과해야 합니다.
이 큐의 각 구성요소 중 하나라도 문제가 있게 되면 클러스터는 디스크를 찾을 수 없게 됩니다.

---------------------------------------------------------------------
Cluster APP (가칭 :클러스터의 소프트웨어 모듈을 가르킴)
---------------------------------------------------------------------
ClusDisk (Disk 장치의 필터 디바이스로 Ownership 관리)
---------------------------------------------------------------------
HBA 관련 모듈 (장치 드라이버를 비롯한 소프트웨어 모듈)
---------------------------------------------------------------------
HBA 카드
---------------------------------------------------------------------
Cable
---------------------------------------------------------------------
SAN Switch
---------------------------------------------------------------------
Cable
---------------------------------------------------------------------
Controller
---------------------------------------------------------------------
Disk
---------------------------------------------------------------------

1. Cluster APP
Cluster는 Disk를 확인 하기 위해 Signature 를 이용합니다.
이 Signature는 Disk의 MBR에 기록 되고, 서버에서는 자신의 레지스트리에 저장된 Signature 정보를 통해 디스크에 접근 하게 됩니다.
즉 Signature 정보에 문제가 있게 되면 Cluster는 Disk를 확인 할 수 없어 문제가 발생합니다.
해당 정보는 아래 레지스트리에서 확인 할 수 있습니다.
HKLM/System/CurrentControlSet/Services/Clusdisk/Parameters
이경우에는 dumpcfg 라는 툴을 이용해서 Disk의 MBR의 Signature를 쉽게 변경 할 수 있습니다.
참고 : http://support.microsoft.com/kb/280425

2. ClusDisk
Disk에 접근하는데 있어 최 상위 물리 계층에서 동작하는 필터 드라이버 입니다.
주요 Role은 Owner Ship 여부에 따라 디스크 접근 권한을 주거나 뺏는 역활 입니다.
Signature 에 문제가 없다면 ClusDisk 의 문제를 추정할 수 있습니다.
하지만 거의 대부분 ClusDisk의 문제는 없고 쿼럼에 접근이 않된다거나 로컬의 클러스터 정보 및 쿼럼의 정보가 손상된 경우가 대부분 입니다.
문제 판별은 http://support.microsoft.com/kb/280425 의 내용과 같이 장치 관리자에서 해당 필터 드라이버를 Disable 시킨 후 문제 여부를 확인 할 수 있습니다.
일반적으로 클러스터의 정보는 HKEY_LOCAL_MACHINE\Cluster 키 밑에 저장되어 있습니다.
그 파일은 SystemRoot%\Cluster\ClusDB 와 Q:\MSCS\Chkxxx.tmp 입니다.
즉 하나라도 정상으로 판별되는 녀석이 있다면 해당 파일로 동기화를 해주게 되면 문제가 해결 되게 됩니다.
물론 쿼럼 손상의 경우 시작 옵션에 fixquorom 을 주거나 쿼럼을 재 생성해도 문제를 해결할 수 있습니다.

3. HBA 관련 모듈
디바이스 드라이버 및 해당 드라이버를 지원하기 위한 S/W를 통칭 합니다.
즉 이 부분 부터는 장치의 문제로 볼 수 있으며 해당 장치를 fix 해주면 됩니다.

4. HBA 카드 ~ Disk
솔직히 MS만 하는 저는 뭐라 말씀 드릴 부분이 없습니다.
장치의 문제로 볼 수 있으며 해당 구간 구간에 대한 TEST가 진행 되어야 합니다.

[기타]
시작 옵션 정리
net start clussvc /NoQuorumLogging
net start clussvc /ResetQuorumLog
net start clussvc /FixQuorum

  MSCS 로 구성된 Passive 노드에서 상태 백업이 안된다. 
작성일시 : 2008.06.19 16:55 | 분류 : Windows Server/Cluster | 태그 : backup, Cluster, cluster system status backup, vssadmin list writers

쿼럼을 포함한 경우에만 system 상태 백업이 가능합니다.
실제로 vssadmin list writers 를 통해 Backup Writer 들의 장애 원인을 살펴 볼 수 있습니다.
그중 쿼럼이 없을 경우에는 아래와 같은 메세지가 발생합니다.

쿼럼 미 소유 시 확인 가능한 메세지

전체 메세지

참고 : http://www.microsoft.com/technet/prodtechnol/windowsserver2003/technologies/clustering/sercbrbp.mspx

 Prev   1   Next