2015년 10월 20일 화요일

실험실에서 사용하는 Intel RAID 카드에 대해서


Intel Raid카드를 쓰게되는 이유?

서론



  • 데이터의 저장이 매우 중요한 입자물리 실험 연구실은 다른 타 연구실보다 디스크 저장용량에 대한 관심이 크기 마련이다. 우리 실험의 경우에도 2015년 10월 20일 현재 250TB의 용량을 지원하기 위해 스토리지 서버만 9대를 운영하고 있다.
    (물론, 우리 연구실이 CMS Tier3 센터긴 하지만..)
  • 파일시스템은 Lustre를 쓰고 있고 이에 대한 글은 이미 썼으니, 이번에는 RAID카드에 대한 이야기를 하는게 좋을 거 같다.
    • 아무래도, 우리 연구실은 Intel 친화적이다보니 모든 장비들이 어느새인가 인텔 장비임을 발견할 수 있다. 

인텔 Raid카드의 종류

  • 16채널 장비(SE07, SE08, SE09) 의 RMS25CB040


    • 16채널 장비를 지원하기 위한 레이드 카드
      • RAID6를 이용 중!
  • 기타 장비는 추후 업데이트할 수도 있음
    • 어차피 설정은 똑같으니 뭐..

어떤 RAID 옵션을 선택하여야 하는가?


  • RAID0 
    • Stripe라고 하며 하드디스크 여러 개를 하나의 디스크인 것처럼 사용하게 해주며, 속도 향상에 엄청난 도움을 주기 때문에 오버클러커나 하드코어 유저에게는 친숙한 RAID라고 한다.
    • 물론, 우리랑은 별로 안 친하다.
  • RAID1
    • Mirroring이라고 한다. 흔히 이야기 하는 미러 사이트 처럼 디스크 2개를 똑같이 쓰고 똑같이 읽어낸다. 즉, 2개로 구성된 RAID1은 쓰기속도는 1개랑 같고 읽기 속도는 2배가 된다.
    • 디스크 물량이 충분할 경우, 주요 서버의 root파티션이나 /boot 파티션을 보호하기 위하여 Software Raid1으로 구성하는 경우가 종종 있다.
      • 구성만 된다면 하나의 디스크가 파손되더라도 OS를 재설치하는 불우한 경우를 면할 수 있게 된다.
        • 물론, 투자할 시간이 많다면 아무래도 상관 없지만,
  • RAID5
    • RAID5부터 진정한 레이드라고 볼 수 있는데 어쩌면 RAID5나 6 때문에 위의 레이드 카드를 구매한다고 생각하면 된다.
      • 소프트웨어나 내장 레이드에 비해 퍼포먼스가 확실히 상승.
    • RAID5는 3개의 디스크 기준으로 패리티 정보를 각각 저장하므로써 3개 중 하나의 디스크가 파손되더라도 이를 복구해낼 수 있는 장점이 있다.
      • 디스크 3개가 필요하다는 단점이 있지만 RAID1보다 낭비되는 용량이 확연히 줄게 된다.
    • 예전에 한번 구성했다가 몇번 날려먹은 뒤로는 잘 안 쓰는 레이드 모드이다.
  • RAID6
    • RAID5에다가 디스크가 하나 더 포함되었다고 생각하면 된다.
    • 2+2의 구성이 가장 작은 규모의 구성이며, 디스크가 2개가 망가졌을 때에도 이를 복구해낼 수가 있다.
      • 의외로 리빌딩 작업 중 추가 하드디스크의 손상은 자주 있는 일이라고 한다.

연구실에서는 RAID6가 기본이라고 생각하자.


  • 기본적으로 저장서버의 경우 RAID6를 추천하고 있다. 
    • (Lustre 메뉴얼 및 발표자료에 보면 수많은 추천사항을 볼 수 있음)

RAID 중 디스크 fail시

  1. Intel Raid 카드의 경우

    • 디스크 손상시 다음과 같은 상태가 된다.
      • 왼쪽 2번째 위에서 3번째 칸 하드디스크를 살펴보면 붉은색 경고창을 볼 수 있다.
      • 물론, 서버에서 알람 소리가 나기 때문에 소리로 먼저 알게된다.
    • 핫스왑베이 이기 때문에 그냥 꺼내다가 하드를 교체 후 다시 삽입하면 된다.
      • 이럴 경우, 기본적으로라면 자동으로 리빌딩 작업이 진행된다.
        • 붉은색과 녹색 불로 왔다갔다하면서 작업 진행
          • 리빌딩은 시간이 매우 오래 걸리니깐 걸어놓고 잊어먹자
      • 자동으로 리빌딩이 안된다면,
        • RAID Web Controller for Linux x64 version 설치
        • 압축을 풀고 disk/RunRPM.sh 파일을 실행하면 설치 진행
          • 설치시 SNMP 프로토콜 충돌이 안 나도록 잘 할 것!
          • 서버에 문제가 있다면 popup 창에 경고가 나오니 살펴보도록! ( dismiss 이외의 기능은 없다.)
        • 실행
          • /usr/local/RAID\ Web\ Console\ 2/startupui.sh 
            • Login시 root 계정의 암호 필요
            • 현재 디스크 고장으로 Rebuild 중. More details 를 보면 리빌드까지 얼마나 남았는지 확인 가능하다.

  2. Software Raid의 경우
    • 추후 기재


댓글 없음:

댓글 쓰기