Maystyle :
Admin : New post
Guestbook
Local
media
Catergories
Recent Articles
Recent Comments
Recent Trackbacks
Calendar
Tag
Archive
Link
Search
 
  Cluster의 Disk 접근 문제 
작성일시 : 2008. 10. 17. 11:39 | 분류 : Windows Server/Cluster

클러스터를 운영하는 중에 ClusSvc 에 1034 이벤트와 함께 DISK를 찾을 수 없다는 문제가 발생하는 경우가 있습니다.

cluster가 Disk에 접근 하기 까지는 아래와 같은 큐를 통과해야 합니다.
이 큐의 각 구성요소 중 하나라도 문제가 있게 되면 클러스터는 디스크를 찾을 수 없게 됩니다.

---------------------------------------------------------------------
Cluster APP (가칭 :클러스터의 소프트웨어 모듈을 가르킴)
---------------------------------------------------------------------
ClusDisk (Disk 장치의 필터 디바이스로 Ownership 관리)
---------------------------------------------------------------------
HBA 관련 모듈 (장치 드라이버를 비롯한 소프트웨어 모듈)
---------------------------------------------------------------------
HBA 카드
---------------------------------------------------------------------
Cable
---------------------------------------------------------------------
SAN Switch
---------------------------------------------------------------------
Cable
---------------------------------------------------------------------
Controller
---------------------------------------------------------------------
Disk
---------------------------------------------------------------------

1. Cluster APP
Cluster는 Disk를 확인 하기 위해 Signature 를 이용합니다.
이 Signature는 Disk의 MBR에 기록 되고, 서버에서는 자신의 레지스트리에 저장된 Signature 정보를 통해 디스크에 접근 하게 됩니다.
즉 Signature 정보에 문제가 있게 되면 Cluster는 Disk를 확인 할 수 없어 문제가 발생합니다.
해당 정보는 아래 레지스트리에서 확인 할 수 있습니다.
HKLM/System/CurrentControlSet/Services/Clusdisk/Parameters
이경우에는 dumpcfg 라는 툴을 이용해서 Disk의 MBR의 Signature를 쉽게 변경 할 수 있습니다.
참고 : http://support.microsoft.com/kb/280425

2. ClusDisk
Disk에 접근하는데 있어 최 상위 물리 계층에서 동작하는 필터 드라이버 입니다.
주요 Role은 Owner Ship 여부에 따라 디스크 접근 권한을 주거나 뺏는 역활 입니다.
Signature 에 문제가 없다면 ClusDisk 의 문제를 추정할 수 있습니다.
하지만 거의 대부분 ClusDisk의 문제는 없고 쿼럼에 접근이 않된다거나 로컬의 클러스터 정보 및 쿼럼의 정보가 손상된 경우가 대부분 입니다.
문제 판별은 http://support.microsoft.com/kb/280425 의 내용과 같이 장치 관리자에서 해당 필터 드라이버를 Disable 시킨 후 문제 여부를 확인 할 수 있습니다.
일반적으로 클러스터의 정보는 HKEY_LOCAL_MACHINE\Cluster 키 밑에 저장되어 있습니다.
그 파일은 SystemRoot%\Cluster\ClusDB 와 Q:\MSCS\Chkxxx.tmp 입니다.
즉 하나라도 정상으로 판별되는 녀석이 있다면 해당 파일로 동기화를 해주게 되면 문제가 해결 되게 됩니다.
물론 쿼럼 손상의 경우 시작 옵션에 fixquorom 을 주거나 쿼럼을 재 생성해도 문제를 해결할 수 있습니다.

3. HBA 관련 모듈
디바이스 드라이버 및 해당 드라이버를 지원하기 위한 S/W를 통칭 합니다.
즉 이 부분 부터는 장치의 문제로 볼 수 있으며 해당 장치를 fix 해주면 됩니다.

4. HBA 카드 ~ Disk
솔직히 MS만 하는 저는 뭐라 말씀 드릴 부분이 없습니다.
장치의 문제로 볼 수 있으며 해당 구간 구간에 대한 TEST가 진행 되어야 합니다.

[기타]
시작 옵션 정리
net start clussvc /NoQuorumLogging
net start clussvc /ResetQuorumLog
net start clussvc /FixQuorum

|