Tôi nên đặt kích thước đơn vị phân bổ là bao nhiêu khi định dạng?

Tác giả sysadmin, T.Ba 27, 2023, 02:19:19 CHIỀU

« Chủ đề trước - Chủ đề tiếp »

0 Thành viên và 1 Khách đang xem chủ đề.

Tôi nên đặt kích thước đơn vị phân bổ là bao nhiêu khi định dạng?


Bạn nên sử dụng kích thước đơn vị phân bổ mặc định được khuyến nghị khi định dạng ổ đĩa. Đối với các ổ đĩa NTFS, phổ biến trên Windows, có thể sẽ là 4096 byte. Nếu bạn chỉ định lưu trữ các tệp lớn trên một ổ đĩa, vui lòng sử dụng kích thước đơn vị phân bổ lớn hơn --- nó sẽ cải thiện hiệu quả lưu trữ của bạn.


Khi bạn định dạng thiết bị lưu trữ mới, có thể là ổ đĩa thể rắn bên trong hoặc ổ đĩa flash bên ngoài, bạn có thể chọn hệ thống tệp bạn muốn sử dụng và kích thước đơn vị phân bổ. Nhưng kích thước đơn vị tệp phân bổ là gì và nó làm gì? Đây là tất cả mọi thứ bạn cần biết.

1. Kích thước đơn vị phân bổ là gì?

Kích thước đơn vị phân bổ — còn được gọi là "Kích thước cụm" hoặc "Kích thước khối" — đề cập đến kích thước của các khối mà ổ đĩa thể rắn (SSD) hoặc ổ đĩa cứng (HDD) được chia thành. Khi bạn tăng kích thước của đơn vị phân bổ, "khối", bạn sẽ giảm tổng số đơn vị phân bổ trên ổ đĩa của mình. Nếu bạn giảm kích thước của đơn vị phân bổ, điều ngược lại sẽ xảy ra — bạn tăng số lượng đơn vị phân bổ trên ổ đĩa.

Lưu ý: Thuật ngữ "Đơn vị phân bổ", "Khối" và "Cụm" đều đề cập đến cùng một thứ trong ngữ cảnh này và chúng tôi sẽ sử dụng chúng thay thế cho nhau trong bài viết này. Thuật ngữ khối thường được thấy khi nói về Linux, đặc biệt là hệ thống tệp ext4, trong khi cụm và đơn vị phân bổ được thấy với Windows.

Nếu một tệp quá lớn để vừa trong một khối, thì tệp đó sẽ được chia nhỏ và mở rộng ra nhiều khối. Nếu một tệp nhỏ hơn kích thước khối, thì nó sẽ được lưu trữ trong khối đó, nhưng toàn bộ dung lượng khối sẽ được sử dụng hết. Điều này có thể dẫn đến việc lưu trữ không hiệu quả trong một số trường hợp đặc biệt, nhưng chúng ta sẽ đi vào chi tiết hơn sau.

Dưới đây là một ví dụ ngắn gọn về cách các đơn vị phân bổ, kích thước của các đơn vị phân bổ và dung lượng ổ đĩa lưu trữ của bạn có liên quan với nhau. Để làm cho phép toán trở nên dễ dàng, chúng ta sẽ nói về một ổ cứng giả định cực nhỏ với tổng dung lượng là 16.384 kilobyte (16 MB) — nhỏ đến mức phi lý theo tiêu chuẩn của thế kỷ 21, nhưng lại thuận tiện để minh họa điểm này.

Vì vậy, bạn cắm ổ đĩa 16.384 kilobyte của mình và chọn phân vùng nó dưới dạng  hệ thống tệp NTFS. Kích thước đơn vị phân bổ mặc định cho ổ đĩa NTFS có kích thước đó là 4069 byte hoặc 4 KB. Ổ đĩa của bạn sẽ có 16.384/4 (4.096) đơn vị — hoặc khối— trên đó. Nếu bạn tăng kích thước đơn vị phân bổ của mình lên 32 kilobyte, thay vào đó, bạn sẽ có 16.384/32 (512) cụm. Điều này áp dụng cho mọi ổ cứng HDD hoặc SSD có kích thước bất kỳ, mặc dù các ổ đĩa lớn hơn mà chúng ta sử dụng ngày nay sẽ có nhiều triệu khối thay vì vài nghìn khối.

2. Bạn nên sử dụng kích thước đơn vị phân bổ nào?

Bạn nên sử dụng kích thước đơn vị phân bổ mặc định được đề xuất khi định dạng thiết bị lưu trữ của mình trừ khi bạn có lý do cực kỳ cụ thể để thay đổi kích thước đó. Đối với ổ đĩa NTFS trung bình, đó sẽ là 4.096 byte hoặc 4 KB.


Kích thước mặc định thay đổi tùy thuộc vào kích thước của phân vùng và hệ thống tệp bạn đang sử dụng. Nói chung, khi phân vùng trở nên lớn hơn, thì kích thước đơn vị phân bổ cũng vậy. Chúng tôi đã tập hợp một số bảng so sánh NTFS, FAT32 và exFAT vì chúng là các định dạng phổ biến nhất mà bạn sẽ gặp và thường được sử dụng với  ổ flash USB, ổ lưu trữ và thẻ SD.

NTFS


FAT32


exFAT


3. Tại sao thay đổi kích thước đơn vị phân bổ?

Ít nhất về mặt lý thuyết, việc thay đổi kích thước đơn vị phân bổ có thể tối ưu hóa tốc độ ổ đĩa hoặc dung lượng lưu trữ. Trong thực tế, bạn có thể sẽ không nhận thấy điều này hoặc không quan tâm lắm nếu bạn gắn bó với giá trị mặc định, vì các ổ đĩa hiện đại đều lớn và cực kỳ nhanh. Thực sự chỉ có hai trường hợp cực đoan mà bạn có thể phải lo lắng về điều này:

  • Khi bạn có một vài tệp lớn và bạn chọn kích thước đơn vị phân bổ nhỏ
  • Kịch bản ngược lại, khi bạn có rất nhiều tệp nhỏ và bạn chọn kích thước đơn vị phân bổ lớn.

Nếu bạn chỉ có một vài tệp lớn và bạn sử dụng tùy chọn 4096 byte, bạn sẽ tạo ra rất nhiều cụm (kích thước ổ đĩa tính bằng byte/4096 byte) chỉ chứa một vài tệp. Mỗi đơn vị phân bổ kết thúc chỉ nắm giữ một phần nhỏ trong tổng số tệp. Ví dụ: nếu bạn có kích thước đơn vị phân bổ 4096 byte và bạn có tệp 12 KB, bạn cần sử dụng ba đơn vị phân bổ (hoặc khối) để lưu trữ tệp hoàn chỉnh. Bạn càng sử dụng nhiều khối để lưu trữ tệp, khả năng bị phân mảnh càng lớn và hệ điều hành của bạn càng cần theo dõi nhiều khối hơn. Điều này có thể làm chậm hiệu suất ổ đĩa của bạn.

Lưu ý: Sự phân mảnh không phải là vấn đề như trước đây. Windows tự chống phân mảnh thường xuyên và có thể bạn sẽ không bao giờ nhận thấy điều đó xảy ra.

Trong tình huống ngược lại - nhiều tệp nhỏ có kích thước phân bổ lớn - bạn sẽ lãng phí không gian lưu trữ. Mỗi đơn vị cấp phát chỉ được chứa tối đa một tệp. Nếu bạn có kích thước đơn vị phân bổ là 64 kilobyte và bạn ghi một tệp 3 kilobyte vào đó, thì toàn bộ khối đó sẽ được lấp đầy. Điều đó có nghĩa là bạn đã sử dụng hết 64 kilobyte dung lượng lưu trữ để chỉ lưu trữ 3 kilobyte. Nếu bạn có đủ tệp 3 KB để lấp đầy toàn bộ ổ đĩa được định dạng theo cách đó, bạn sẽ lãng phí hơn 95% tổng dung lượng của ổ đĩa. Nếu bạn thu nhỏ kích thước đơn vị phân bổ của mình xuống 4KB, thì bạn chỉ lãng phí 25% tổng dung lượng của ổ đĩa. Tuy nhiên, đó là một ví dụ điển hình và bạn sẽ không thường thấy những tổn thất như vậy với mức sử dụng trung bình.

Lượng dung lượng lãng phí trung bình bằng một nửa kích thước đơn vị (khối) phân bổ cho mỗi tệp trên ổ đĩa. Vì vậy, nếu bạn chọn kích thước khối 4096 byte và bạn có 100.000 tệp, bạn sẽ chỉ lãng phí khoảng 200 megabyte (4KB/2*100.000) dung lượng lưu trữ. Mặt khác, nếu bạn chọn kích thước khối 64 KB với 100.000 tệp, bạn sẽ lãng phí trung bình 3,2 gigabyte. Nó thực sự không phải là điều gì đó để mất ngủ khi xem xét kích thước của ổ SSD và ổ cứng hiện đại.

Nếu bạn biết trước rằng bạn sẽ chỉ lưu trữ các tệp lớn hơn trên một ổ đĩa, chẳng hạn như nếu bạn đang lưu trữ Jellyfin Media Server của riêng mình, thì chắc chắn sẽ không hại gì khi sử dụng kích thước đơn vị phân bổ lớn hơn. Nếu không, bạn nên giữ giá trị mặc định.