RAID và các loại RAID thông dụng trên thế giới

Tác giả admin+, T.Ba 15, 2011, 05:46:27 CHIỀU

« Chủ đề trước - Chủ đề tiếp »

0 Thành viên và 1 Khách đang xem chủ đề.

RAID và các loại RAID thông dụng trên thế giới


RAID (Mảng Dự Phòng Tạo Nên Từ Các Đĩa Độc Lập) đề cập đến hệ thống nhiều đĩa độc lập (các khối vàng ở trong hình) kết hợp với nhau tạo nên một mảng logic lớn (khối vẽ đứt nét). Dữ liệu được lưu trữ trong mảng các đĩa này cùng với dữ liệu dự phòng.

Dữ liệu dự phòng có thể là bản thân dữ liệu (nhân bản), hoặc dữ liệu chẵn lẻ tính được từ nhiều khối dữ liệu ( RAID 4, hoặc RAID 5). Có hệ thống RAID trong máy, hệ điều hành (Windows*, NetWare*, hoặc Unix) không còn làm việc với từng ổ đĩa nữa, mà làm việc với toàn bộ mảng đĩa như là một ổ đĩa logic.

Mục tiêu chính của RAID là nâng cao tính khả dụng và an toàn của dữ liệu. RAID ngăn ngừa tình trạng không hoạt động xảy ra khi một ổ đĩa cứng hư hỏng, tuy nhiên nó không thể phục hồi được dữ liệu đã được người dùng xóa hoặc bị phá hủy khi gặp sự cố lớn như trộm cắp dữ liệu hay hỏa hoạn. Vì vậy, thường xuyên Sao lưu dự phòng cho dữ liệu của bạn là việc bắt buộc phải làm để giữ cho hệ thống của bạn được an toàn khỏi các sự cố này sau khi đã lắp đặt một hệ thống RAID.

Có hai cách để thực hiện một giải pháp RAID. Một bộ điều khiển RAID bằng phần cứng thông minh biết tự xử lý mọi dữ liệu của RAID. Lắp đặt loại hệ thống này, tất cả mọi việc điều khiển mảng RAID đều được tách ra khỏi máy tính chủ và toàn bộ mọi công việc điều khiển đều do bộ điều khiển RAID này thực hiện. Cách khác là thực hiện một hệ thống RAID với một bộ tiếp hợp với máy chủ và một trình điều khiển RAID. Với loại hệ thống này, trình điều khiển được tích hợp vào trong hệ điều hành, tức hệ điều hành Windows* NT. Trong trường hợp này, hiệu năng hoạt động của hệ thống RAID hoàn toàn phụ thuộc vào khối lượng dữ liệu mà CPU máy tính chủ phải xử lý, có khả năng trở thành sự cố trong thời gian tái thiết lại mảng đĩa sau khi một ổ đĩa bị hư.

Một số điểm cần lưu ý khi với bộ điều khiển RAID bằng phần cứng là: Dễ cài đặt và bảo trì, các khả năng của phần mềm quản lý và kinh nghiệm của nhà sản xuất khi xây dựng các bộ phận của RAID. Một bộ điều khiển RAID phải hỗ trợ các Cấp RAID quan trọng nhất (0, 1, 4, 5 và 10), và phải có khả năng đồng thời xử lý nhiều mảng đĩa với nhiều cấp RAID khác nhau trong nhiều kênh.

Các cấp RAID – Cách sắp xếp các ổ đĩa

Mỗi cấp RAID phân tán dữ liệu ra khắp các ổ đĩa của mảng theo các cách khác nhau và được tối ưu hóa cho các tình huống cụ thể. Với mục đích của chúng ta, chúng ta sẽ tập trung vào các cấp RAID thường được sử dụng nhất trong thời gian này.

Cách xác định cấp cho RAID của bạn

1. RAID 0

Cấp RAID này kết hợp từ hai ổ đĩa cứng trở lên theo cách các dữ liệu (ABCD.. trong các khối màu vàng) từ người dùng được cắt ra thành nhiều khối có thể quản lý được. Các khối này được phân tán lên khắp các ổ đĩa khác nhau trong mảng đĩa RAID 0. Bằng cách thực hiện này, kết hợp hai hay nhiều ổ cứng, hiệu năng đọc/viết, đặc biệt là khả năng truy cập tuần tự, có thể được cải thiện. Tuy nhiên, không có dữ liệu dự phòng nào được lưu trên mảng RAID 0 cả, nghĩa là nếu một đĩa cứng hư hỏng, tất cả dữ liệu sẽ bị mất. Thiếu dữ liệu dự phòng cũng được thể hiện bởi con số 0, chỉ ra rằng chẳng có dữ liệu dự phòng nào cả. RAID 0 vì vậy luôn không được dùng trong những máy chủ có quan tâm nhiều đến vấn đề an toàn.

Ưu điểm: Tốc độ truyền dữ liệu cao nhất
Nhược điểm: Không dự phòng dữ liệu, tức là, nếu có một đĩa hư thì tất cả mọi dữ liệu sẽ mất
Ứng dụng: Chủ yếu được sử dụng trong các máy trạm để lưu dữ liệu tạm thời và đạt được tốc độ truyền dữ liệu nhập/xuất cao

2. RAID 1

Trong hệ thống RAID 1, dữ liệu y hệt nhau được lưu trên hai đĩa cứng (dự phòng dữ liệu 100%). Khi một ổ đĩa cứng hư, tất cả mọi dữ liệu trên đĩa kia sẽ được sử dụng ngay lập tức không hề ảnh hưởng đến hiệu năng hoạt động hoặc tính toàn vẹn của dữ liệu. Chúng ta đề cập đến "Nhân Bản Dữ Liệu Trên Các Đĩa Cùng Kênh" ("Disk Mirroring") khi hai ổ đĩa được lưu y hệt nhau trên một kênh SCSI. Nếu mỗi ổ đĩa được nối vào một kênh SCSI riêng, chúng ta gọi là "Nhân Bản Dữ Liệu Trên Các Đĩa Khác Kênh" ("Disk Duplexing") (an toàn hơn). RAID 1 là giải pháp đơn giản và có hiệu quả cao để đạt được mục tiêu an toàn dữ liệu và khả năng hoạt động liên tục của hệ thống.


Ưu điểm: Khả năng hoạt động liên tục cao, một ổ đĩa có thể hư, nhưng Ổ Đĩa Logic vẫn có dữ liệu để sử dụng
Nhược điểm: Cần phải có 2 đĩa nhưng chỉ sử dụng được có một đĩa để lưu trữ
Ứng dụng: Thường được dùng cho các hệ thống nhỏ chỉ cần sử dụng dung lượng 1 đĩa và cho các đĩa khởi động

3. RAID 4

RAID 4 rất giống RAID 0. Dữ liệu được phân tán lên khắp các ổ đĩa. Ngoài ra, bộ điều khiển RAID cũng trù tính đến việc dự phòng dữ liệu (thông tin chẵn lẻ) lưu trên một ổ đĩa riêng (P1, P2,...). Ngay cả khi một ổ đĩa hư hỏng, tất cả mọi dữ liệu cũng vẫn có đầy đủ để sử dụng. Dữ liệu bị mất được tìm lại bằng cách tính toán xác định phần dữ liệu còn lưu lại và từ các thông tin chẵn lẻ.

Khác với RAID, chỉ cần dùng dung lượng của một đĩa để cho các dữ liệu dự phòng. Chúng ta thử tính, ví dụ, một mảng đĩa RAID 4 có 5 đĩa, thì 80 phần trăm dung lượng đĩa cài đặt là có thể sử dụng cho người dùng lưu trữ, chỉ 20 phần trăm là dùng cho việc lưu dự phòng. Trong các trường hợp có nhiều khối dữ liệu nhỏ, ổ đĩa chẵn lẻ sẽ trở nên bị nghẽn cổ chai. Với các khối dữ liệu lớn, RAID 4 tỏ ra cải thiện được hiệu năng với mức độ đáng kể.

Ưu điểm: Khả năng hoạt động liên tục cao, một đĩa có thể hư, nhưng Ổ Đĩa Logic vẫn có dữ liệu để sử dụng. Tận dụng được dung lượng đĩa để lưu trữ(mảng n đĩa, n-1 đĩa được dùng để lưu trữ)
Nhược điểm: Phải tính toán thông tin dữ liệu dự phòng, gây hạn chế hiệu năng ghi đĩa
Ứng dụng: Do có tỷ lệ dung lượng lưu trữ so với dung lượng lắp đặt cao nên thường được dùng cho các hệ thống lớn để lưu trữ dữ liệu

4. RAID 5

Khác với RAID 4, dữ liệu chẵn lẻ trong một mảng đĩa RAID 5 được phân tán ra khắp tất cả các ổ đĩa. Mảng đĩa RAID 5 cho năng suất cân đối hơn. Ngay cả với những khối dữ liệu nhỏ, rất thường gặp trong những môi trường đa nhiệm và đa người dùng, thời gian đáp ứng rất tốt.

RAID 5 cho độ an toàn tương đương với RAID 4: Khi một ổ đĩa hư hỏng, tất cả mọi dữ liệu cũng vẫn có đầy đủ để sử dụng. Dữ liệu bị mất được tìm lại bằng cách tính toán xác định lại phần dữ liệu còn lưu lại và từ các thông tin chẵn lẻ.

Ưu điểm: Khả năng hoạt động liên tục cao, một đĩa có thể hư, nhưng Ổ Đĩa Logic vẫn có dữ liệu để sử dụng. Tận dụng được dung lượng đĩa để lưu trữ(mảng n đĩa, n-1 đĩa được dùng để lưu trữ)
Nhược điểm: Phải tính toán thông tin dữ liệu dự phòng, gây hạn chế hiệu năng ghi đĩa
Ứng dụng: Do có tỷ lệ dung lượng lưu trữ so với dung lượng lắp đặt cao nên thường được dùng cho các hệ thống lớn để lưu trữ dữ liệu

5. RAID 10

RAID 10 là sự kết hợp của RAID 0 (Hiệu năng) với RAID 1 (An Toàn Dữ Liệu). Khác với RAID 4 và RAID 5, không cần phải tính toán thông tin chẵn lẻ. Mảng đĩa RAID 10 cho hiệu năng hoạt động và an toàn dữ liệu tốt. Tương tự như RAID 0, hiệu năng tối ưu đạt được trong các tình huống nạp có trình tự cao. Tương tự như RAID 1, 50 phần trăm dung lượng cài đặt bị mất cho việc dự phòng dữ liệu.


Ưu điểm: Khả năng hoạt động liên tục cao, một đĩa có thể hư, nhưng Ổ Đĩa Logic vẫn có dữ liệu để sử dụng. Có hiệu năng ghi đĩa cao
Nhược điểm: Cần tối thiểu 4 đĩa chẵn, chỉ một nửa số đĩa được dùng cho lưu trữ
Ứng dụng: Thường được dùng cho các trường hợp đòi hỏi hiệu năng ghi đĩa có trình tự cao

6. RAID 6

RAID 6 phần nào giống như RAID 5 nhưng lại được sử dụng lặp lại nhiều hơn số lần sự phân tách dữ liệu để ghi vào các đĩa cứng khác nhau. Ví dụ như ở RAID 5 thì mỗi một dữ liệu được tách thành hai vị trí lưu trữ trên hai đĩa cứng khác nhau, nhưng ở RAID 6 thì mỗi dữ liệu lại được lưu trữ ở ít nhất ba vị trí (trở lên), điều này giúp cho sự an toàn của dữ liệu tăng lên so với RAID 5.

RAID 6 yêu cầu tối thiểu 4 ổ cứng.

Trong RAID 6, ta thấy rằng khả năng chịu đựng rủi ro hư hỏng cứng được tăng lên rất nhiều. Nếu với 4 ổ cứng thì chúng cho phép hư hỏng đồng thời đến 2 ổ cứng mà hệ thống vẫn làm việc bình thường, điều này tạo ra một xác xuất an toàn rất lớn. Chính do đó mà RAID 6 thường chỉ được sử dụng trong các máy chủ chứa dữ liệu cực kỳ quan trọng.