본문 바로가기
[INFRA]

[INFRA] Raid란

by METAVERSE STORY 2022. 8. 18.
반응형

 

 

Raid란 Redundant Array of Inexpensive/Independant Disk의 약자이다.

저장장치 여러 개를 묶어 고용량, 고성능 저장 장치 한개와 같은 효과를 얻기 위해 개발된 기법이다.
초기에는 업그레이드 후 '폐기하기엔 아깝고, 그렇다고 단독으로 쓰기에는 성능이 부족한' 저장장치를 재활용할 목적으로 사용하였다. 저장장치 기술이 발전한 현재는 Inexpensive보다는 Independent로 해석하는 추세이다.

RAID의 주 사용 목적은 크게 무정지 구현(안정성)과 고성능 구현으로 구분된다. 무정지 구현을 극도로 추구하면 RAID 1, 고성능 구현을 극도로 추구하면 RAID 0이 되며, RAID 5,6은 둘 사이에서 적당히 타협한 형태이다.
RAID 10이나 RAID 01과 같이 두 가지 방식을 혼용하는 경우도 있다.

보통은 같은 모델 같은 주차의 제품으로 하는 것이 권장되지만, 이를 유지하기 힘든 개인용의 경우 어쩔 수 없이 서로 다른 두 모델을 혼용할 수 밖에 없는 상황이 있다. 
물론 그렇다고 RAID가 안되는 것은 아니며 HDD + SDD 같이 이상하게 구성하지 않는 이상은 성능 향상도 확실히 있다.
다만 SLI 처럼 성능이 낮은 쪽으로 하향 평준화되어 거기에 배수가 곱해진다는것이 차이점이다.

쉽게 말해
1. 운용 가용성, 데이터 안정성 증대
2. 디스크 용량 증설의 용이성
3. 디스크 I/O 성능 향상

그렇다면 아래에 순서대로 RAID의 종류에 대해서 알아보도록 하자.

 

1. RAID 0

위 구성에는 스트라이핑이 있지만 데이터의 중복은 없다. 최상의 성능을 제공하지만 내결함성은 제공하지 않는다.
장정 : 데이터를 사용할 때 I/O를 디스크 수 만큼 분할하여 쓰기 때문에 I/O 속도가 향상 된다.
단점 : 스트라이프를 구성할 시 기존 데이터는 모두 삭제 되어야 한다.

최소 디스크 개수 : 2
용량 : 디스크 수 X 디스크 용량

 

2. RAID 1

디스크 미러링이라고도 하는 이 구성은 데이터 저장소를 복제하는 두 개 이상의 드라이브로 구성된다. 스트라이핑 구성이 아니며 두 디스크를 동시에 읽을 수 있기 때문에 읽기 성능이 향상된다. 쓰기 성능은 단일 디스크에 쓰는 것과 같다.
장점 : 볼륨 내 디스크 중 하나의 디스크만 정상이어도 데이터는 보존되어 운영이 가능하기 때문에 가용성이 높고, 복원이 비교적 매우 간단하다.
단점 : 용량이 두 배가 필요하며 쓰기 속도가 조금 느려진다.

최소 디스크 개수 : 2
용량 : (디스크 수/2) X 디스크 용량

 

3. RAID 2

RAID 2는 RAID 0 처럼 스트라이핑 구성이지만 일부 디스크에는 오류 검사 및 수정을 위해 ECC(Error Correction Code) 정보가 저장된다. RAID 3~4에 비해 이점이 없으며 현재는 더 이상 사용되지 않는 구성이다.
단점 : ECC를 위한 드라이브가 손상될 경우는 문제가 발생할 수 있으며 패리티 정보를 하나의 하드 드라이브에 저장하는 RAID 4가 나오면서 폐기되었다.

최소 디스크 개수 : 3
용량 : (디스크 수 -1) X 디스크 용량

 

4. RAID 3

RAID 3 구성은 스트라이핑을 사용하고 하나의 드라이브를 패리티 정보를 저장하는데 사용된다. 내장 된 ECC 정보는 오류를 감지하는데 사용된다. 데이터 복구는 다른 드라이브에 기록된 정보의 배타적 OR (XOR)을 계싼하여 수행된다. I/O 작업은 동시에 모든 드라이브를 처리하므로 RAID 3은 I/O를 중첩 할 수 없다. 이러한 이유 때문에 RAID 3은 수행시간이 긴 응용 프로그램이 있는 단일 사용자 시스템에 가장 적합하다.

최소 디스크 개수 : 3
용량 : (디스크 수 -1) X 디스크 용량

 

5. RAID 4

RAID 4 구성은 RAID 3 구성과 거의 동일하다고 보면되며 스트라이프를 사용하므로 단일 드라이브에서 데이터를 읽을 수 있다. 그리고 모든 쓰기 작업은 패리티 드라이브를 업데이트 해야 하지만, 별도의 디스크이기 때문에 I/O 충돌이 발생하지 않는다. 
RAID 3과 RAID 4를 정리하면 RAID 0, RAID 1의 문제점을 보오나하기 위해 설계되었으며 3,4 로 나뉘긴 하지만 그림 처럼 RAID 구성 방식은 거의 같다.
RAID 3, 4는 기본적으로 RAID 0와 같은 스트라이핑 구성을 하고 있어서 성능을 보완하고 디스크 용량을 완전히 사용할 수 있게 해준다. 그리고 에러 체크 및 수정을 위해서 패리티 정보를 별도의 디스크에 따로 저장한다.
RAID 3은 데이터를 바이트 단위로 나누어 디스크에 동등하게 분산 기록하며 RAID 4는 데이터를 블록 단위로 나눠 기록하므로 약간의 차이는 존재한다.
RAID 3은 디스크 동기화가 필수적이라 많이 사용되지 않고 RAID 4 역시 RAID 4로 대체되었다.

 

6. RAID 5

이 구성은 패리티가 있는 블록 레벨 스트라이핑을 기반으로 한다. 패리티 정보는 각 디스크에 스트라이핑되므로 하나의 드라이브가 고장 나더라도 다른 어레이로 대체 작동 할 수 있다. 어레이 아키텍처는 읽기 및 쓰기 작업을 여러 드라이브로 확장이 가능하기 때문에 일반적으로 단일 드라이브의 성능보다 좋지만 RAID 0 어레이의 성능은 높지 않다. RAID 5는 3개 이상의 디스카 필요하지만 성능상의 이유로 적어도 5개의 디스크를 사용하는 것이 좋다고 한다.

RAID 5 어레이는 일반적으로 패리티 정보 작성과 관련된 성능 영향으로 인해 쓰기 집약적 시스템에서 사용하기에는 좋지 않은 선택이다. 디스크에 장애가 발생하면 RAID 5 어레이를 재구성하는 데 오랜 시간이 걸릴 수 있기 때문이다. 성능은 대게 재구성 시간 동안 저하되며 어레이는 재구성이 완료 될 때까지 추가 디스크 오류에 취약할 수 밖에 없다.

즉, RAID 5는 RAID3, RAID 4에서 별도의 패리티 정보 디스크를 사용함으로써 발생하는 문제점을 보완하는 방식으로 패리티 정보를 스트라이프로 구성된 디스크 내에서 처리하게 구성한다. 만약 1개의 디스크가 고장 나더라도 남은 디스크들이 복구를 할 수 있기 때문이다.

최소 디스크 개수 : 3
용량 : (디스크 수 -1) X 디스크 용량

 

7. RAID 6

RAID 6은 RAID 5와 비슷한 구성이지만 다른 드라이브들 간에 분포되어 있는 2차 패리티 정보를 넣어 2개의 하드에 문제가 생겨도 복구할 수 있게 설계되었으므로 RAID 5보다 더욱 데이터의 안정성을 보장 할 수 있다. 이러한 추가적 보호 기능은 비용 부담으로 이어질 수 밖에 없다.

최소 디스크 개수 : 4
용량 : (디스크 수 -2) X 디스크 용량

 

8. RAID 10 (RAID 1+0)

RAID 1과 RAID 0을 결합한 이 구성은 RAID 1보다 높은 성능을 제공하지만 추가 비용이 든다. RAID 1+0 에서는 데이터가 미러링되고 미러가 스트라이핑 되기 때문이다.

최소 디스크 개수 : 4
용량 : (디스크 수 / 2) X 디스크 용량

이 외에도

RAID 01(RAID 0+1)
RAID 03(RAID 0+3), RAID 53(RAID 5 + 3)
RAID 50(RAID 5 + 0)
RAID 7(비표준이며 RAID 3,4를 기반으로 하지만 캐싱 추가)
등이 있는데 이는 다 기존의 RAID 구성을 혼합하면 다 만들어 낼 수 있다.

정리하자면 아래와 같다.

장점 : 성능, 탄력성 및 비용은 RAID의 주요 장점이라고 볼 수 있다. 여러 개의 하드 드라이브를 함께 설치하면 RAID를 사용하여 단일 하드 드라이브의 작업을 향상시킬 수 있으며 구성 방법에 따라 충돌 후 컴퓨터 속도와 안정성이 향상 된다.

단점 : 중첩 된 RAID 레벨은 많은 수의 디스크가 필요하기 때문에 기존의 RAID 레벨보다 구현 비용이 비싸다. 대다수의 디스크가 중복성을 위해 사용되기 때문에 중첩된 RAID의 경우 스토리지 비용도 높다. 하지만 중첩된 RAID는 표준 RAID 레벨과 관련된 일부 안정성 문제를 극복하는 데 도움이 되므로 높은 비용에도 불구하고 널리 보급되어 사용되었다.

 

출처 

https://zetastring.tistory.com/121

 

RAID 구조 종류(RAID 0부터 10까지)와 구성 방식 자세한 설명

Redundant Array of Inexpensive/Independent Disk 저장장치 여러 개를 묶어 고용량·고성능 저장 장치 한 개와 같은 효과를 얻기 위해 개발된 기법이다. 초기에는 업그레이드 후 '폐기하기엔 아깝고, 그렇다

zetastring.tistory.com

 

반응형

댓글