GPU có bị hao mòn do sử dụng nhiều không?

Tác giả sysadmin, T.M.Hai 10, 2022, 02:58:50 CHIỀU

« Chủ đề trước - Chủ đề tiếp »

0 Thành viên và 1 Khách đang xem chủ đề.

GPU có bị hao mòn do sử dụng nhiều không?


Nếu bạn dự định chơi game cường độ cao, điện toán GPU, kết xuất đồ họa,  Folding@home hoặc khai thác tiền điện tử trên cạc đồ họa của mình, bạn có thể lo lắng rằng GPU của mình sẽ bị hao mòn do sử dụng nhiều. Nhưng nó sẽ? Chúng tôi sẽ điều tra.


1. Có, nhưng nó phức tạp

Hầu hết thông tin về tuổi thọ của cạc đồ họa mà bạn tìm thấy trực tuyến đều là thông tin không chính thức, với những con số có thể thay đổi đáng kể tùy thuộc vào người bạn hỏi. Với hàng trăm mẫu cạc đồ họa khác nhau được phát hành trong thập kỷ qua, thật khó để tổng hợp dữ liệu về các loại thẻ cực kỳ khác nhau như vậy thành những khái quát đơn giản.

Cho đến nay, chúng tôi biết điều này: Theo một báo cáo năm 2020 từ một nhà bán lẻ của Đức, nhìn chung, hầu hết các cạc đồ họa gần đây đều có tỷ lệ hỏng hóc khoảng 2-5% (được đo bằng số tiền trả lại cho nhà bán lẻ). Và vào năm 2021, Nvidia vẫn cung cấp các bản cập nhật trình điều khiển cho các thẻ có tuổi đời khoảng 9-10 năm (chẳng hạn như dòng GTX 600), vì vậy bạn có thể mong đợi một thập kỷ sử dụng đối với một thẻ GPU được xử lý tốt—mặc dù những thẻ đó có thể là ngoại lệ, như chúng ta sẽ thấy phía trước.

Bất kể những con số, có một số vật lý khó tại nơi làm việc. Các vật liệu và thành phần được sử dụng trong cấu tạo của card GPU không phải là thần kỳ: Bạn càng sử dụng chúng nhiều, các bộ phận xuống cấp càng nhanh và càng có nhiều khả năng chúng sẽ hỏng hoàn toàn. Vì vậy, sử dụng nhiều có ảnh hưởng đến tuổi thọ.


Việc bạn có thấy thẻ GPU của mình bị lỗi hay không tùy thuộc vào các biến số cực kỳ khác nhau, bao gồm mức độ sử dụng chính xác của GPU, tính chất và mức độ dao động nhiệt độ trong mạch, số lần bật và tắt thẻ, và môi trường hoạt động sạch như thế nào.

Bởi vì card GPU là một thiết bị phức tạp với nhiều bộ phận, mỗi bộ phận có thể bị hỏng hoặc xuống cấp theo những cách khác nhau. Chúng ta sẽ xem xét một số bộ phận chính của thẻ GPU và kiểm tra xem chúng có thể bị hao mòn như thế nào do sử dụng nhiều theo thời gian.

2. Đầu tiên đi: Quạt làm mát

Trong số tất cả các bộ phận của card đồ họa có khả năng bị hỏng đầu tiên, chúng ta phải chỉ ra quạt làm mát (hoặc quạt), là bộ phận chuyển động vật lý. Quạt giữ cho GPU của bạn luôn mát bằng cách di chuyển luồng khí nóng ra khỏi chip GPU (có tản nhiệt ) để nó có thể tiếp tục hoạt động.


Tại sao nóng là xấu? Khi đủ nhiệt, các bóng bán dẫn không hoạt động bình thường, điều đó có nghĩa là card GPU sẽ không hoạt động. Với nhiệt độ cao hơn, các bóng bán dẫn trong chip trên thẻ có thể bị hỏng vĩnh viễn.

Theo thời gian, quạt làm mát thường bị bám bụi làm giảm khả năng luân chuyển không khí hiệu quả. Hoặc quạt có thể hỏng hoàn toàn nếu chất bôi trơn bên trong bị hỏng. Một trong hai kịch bản sẽ làm tăng nhiệt độ của GPU.

Mọi GPU đều tự bảo vệ mình khỏi bị quá nhiệt bằng cách sử dụng điều tiết nhiệt, làm chậm hoạt động của GPU để giảm nhiệt độ hoạt động. Làm như vậy hạn chế nghiêm trọng hiệu suất. Vì vậy, nếu GPU của bạn đột nhiên ồn hơn bình thường (quạt quay nhanh hơn) hoặc hoạt động kém hơn, hãy vệ sinh kỹ quạt làm mát và tản nhiệt của GPU bằng khí nén.

Nếu quạt làm mát GPU bị hỏng hoàn toàn, thông thường bạn có thể thay thế nó nếu tìm được quạt tương đương từ nhà cung cấp linh kiện máy tính.

3. Một nghi phạm khác: Hợp chất nhiệt bị lỗi

Giữa mỗi bộ tản nhiệt và chip GPU đều có một lớp vật liệu dẫn nhiệt, chẳng hạn như một miếng bột bả hoặc miếng dán giúp truyền nhiệt từ chip GPU sang bộ tản nhiệt.

Theo thời gian, keo tản nhiệt có thể bị nứt hoặc mất tác dụng. Khi điều đó xảy ra, bộ tản nhiệt không làm mát hiệu quả và nhiệt độ GPU sẽ tăng lên. Như chúng ta đã thấy trong phần quạt ở trên, nhiệt độ GPU cao dẫn đến hiện tượng tiết lưu nhiệt, điều này sẽ làm chậm GPU của bạn.


Cách khắc phục tốt nhất trong trường hợp đó là tự thay keo tản nhiệt. Bạn có thể mua keo tản nhiệt từ những người bán linh kiện máy tính.

4. Thất bại trong các thành phần khác, hàn

Ngoài chip GPU, một card đồ họa sẽ bao gồm hàng chục linh kiện điện tử khác như tụ điện, điện trở, chip nhớ, v.v. Bất kỳ thứ nào trong số đó có khả năng bị hỏng do sử dụng nhiều hoặc tiếp xúc với quá nhiều nhiệt. Một số có nhiều khả năng thất bại hơn những người khác.


Tụ điện nói riêng dễ bị hỏng theo thời gian. Chúng nhạy cảm với sự thay đổi nhiệt độ thường xuyên và một số bị lỗi khi sản xuất lần đầu. Nếu bạn đủ khéo léo để khắc phục các sự cố về tụ điện, bạn có thể thay thế các tụ điện bị hỏng trên thẻ GPU nếu bạn có thể tìm thấy các bộ phận thay thế tương đương.

Ngoài ra, chất hàn liên kết chip và linh kiện với bảng mạch của thẻ GPU của bạn có thể bị lão hóa và nứt theo thời gian do thay đổi nhiệt độ thường xuyên, xử lý vật lý thô, bảo quản không đúng cách hoặc chạy quá nóng. Vì vậy, có, việc sử dụng GPU nặng có thể làm tăng nguy cơ hỏng mối hàn. Sửa chữa các mối hàn hỏng có thể khó về mặt kỹ thuật, nhưng không phải là không thể.

5. Lỗi trong chính Chip GPU

Vì vậy, câu hỏi đặt ra là: Cuối cùng thì chip GPU có bị hao mòn do sử dụng nhiều không? Câu trả lời là có, về mặt lý thuyết, trong những trường hợp khắc nghiệt. Nhưng bạn có thể sẽ thấy lỗi của một thành phần khác trên card đồ họa trước thời điểm đó rất lâu.

Chip GPU trên cạc đồ họa của bạn chứa hàng triệu hoặc hàng tỷ bóng bán dẫn, được khắc vào một miếng silicon. Bóng bán dẫn già đi theo thời gian, ảnh hưởng đến hiệu suất của chúng. Khi có đủ bóng bán dẫn hoạt động sai, chip sẽ bị lỗi.

Theo Semiconductor Engineering, có một số lý do chính khiến các bóng bán dẫn gặp trục trặc theo thời gian do bị lão hóa ( một trong số đó là do nhiệt ) và các lỗi này càng có nhiều khả năng xảy ra khi kích thước tính năng trên chip càng nhỏ. Các chuyên gia nghi ngờ chip máy tính được sản xuất ngày nay sẽ không tồn tại lâu như chip được sản xuất vào những năm 1990, nhưng việc dự đoán tuổi thọ chính xác vẫn chỉ là phỏng đoán vì công nghệ này còn quá mới.


Hiện tại, NVIDIA không công bố ước tính MTBF (thời gian trung bình giữa các lần hỏng hóc) cho cạc đồ họa tiêu dùng của họ, nhưng công ty  có công bố chúng cho một số bộ tăng tốc đồ họa công nghiệp và doanh nghiệp. Ví dụ: bảng dữ liệu cho Bộ tăng tốc GPU Tesla K20X trích dẫn MTBF cho thẻ (ở nhiệt độ 35C/95F) là 14,7 năm đối với "môi trường không được kiểm soát" và 23,8 năm đối với "môi trường được kiểm soát". (Lưu ý rằng nhìn chung, phần cứng đồ họa công nghiệp được kỳ vọng sẽ mạnh mẽ hơn và hoạt động tốt hơn khi sử dụng nhiều so với phần cứng đồ họa tiêu dùng.)

Thật thú vị, chúng ta có thể so sánh con số lý thuyết này với dữ liệu cứng từ ngoài thực địa. Một trong số ít nghiên cứu thực nghiệm về tuổi thọ của GPU được cung cấp bởi một bài báo năm 2020 có tiêu đề " Thời gian sử dụng GPU trên siêu máy tính Titan: Phân tích khả năng sống sót và độ tin cậy " của tác giả Phòng thí nghiệm quốc gia Oak Ridge. Bài báo báo cáo về độ tin cậy của 18.688 card GPU Nvidia K20X Kepler được sử dụng trong siêu máy tính Cray XK7 Titan hiện đã ngừng hoạt động trong khoảng thời gian gần 7 năm (2012-2019).


Sau một số trục trặc ban đầu do sự cố kết nối, họ nhận thấy độ tin cậy tương đối cao với các card đồ họa của XK7 cho đến năm 2016 (khoảng 3-4 năm sau), khi nhiều chiếc bắt đầu bị lỗi. Nhưng đoán xem? Họ đã tìm ra nguyên nhân của hầu hết các lỗi trong lô thẻ đầu tiên (trước khi thay thế) là do một điện trở bị lỗi trên bảng mạch của card đồ họa, chứ không phải bản thân chip GPU. Nhìn chung, các tác giả của nghiên cứu nhận thấy MTBF trung bình của các thẻ GPU được sử dụng nhiều của K20X là khoảng 3 năm (không phải 14-23 năm, như được trích dẫn trong bảng dữ liệu của Nvidia), với một số thẻ nóng nhất trong lõi bị lỗi trước tiên. Họ kết luận, "Độ tin cậy của GPU phụ thuộc vào khả năng tản nhiệt."

Vì vậy, khả năng cao là nếu bạn sử dụng cạc đồ họa của mình với cường độ cao như một trong những siêu máy tính lớn nhất thế giới (vào thời điểm đó), nó sẽ bị hao mòn nhanh hơn và các thành phần khác như quạt và điện trở sẽ hỏng rất lâu trước khi chính chip GPU hoạt động.. Thời gian chính xác bạn sẽ nhận được tùy thuộc vào các yếu tố mà chúng tôi không thể dự đoán.

6. Cuối cùng, nhiệt là kẻ thù

Cuối cùng, từ mọi nguồn mà chúng tôi đã đọc, yếu tố quyết định chính nhất đối với tuổi thọ của một card GPU là mức độ nóng của nó. Thẻ càng nóng, tất cả các thành phần của nó xuống cấp càng nhanh. Ngoài ra, thẻ càng nóng, hiệu suất của nó càng giảm xuống để tránh hỏng hóc nghiêm trọng. Làm mát tốt vừa kéo dài tuổi thọ của thẻ vừa tăng hiệu suất của thẻ.

Vì vậy, cho dù bạn đang khai thác tiền điện tử hay chơi game, nếu bạn giữ cho card GPU của mình mát mẻ ở mức vừa phải với quạt sạch, hoạt động tốt và keo tản nhiệt hiệu quả, thì bạn có thể sẽ có một chiếc card hiệu suất cao, nếu may mắn, có thể tồn tại cho đến khi nó trở nên lỗi thời và bạn nâng cấp.

Nếu bạn định mua GPU đã qua sử dụng, bạn chắc chắn nên tính đến lịch sử của nó, bao gồm cả cách chủ sở hữu xử lý và sử dụng nó. Các thẻ được sử dụng nhiều hơn (hiện đang hoạt động) có thể sẽ hoạt động tốt trong thời gian ngắn nhưng dễ bị hỏng hơn trong thời gian dài. Chúng tôi không thể đưa ra bất kỳ con số chính xác nào về tuổi thọ của card, nhưng việc sử dụng nhiều chắc chắn sẽ làm card đồ họa nhanh hỏng hơn.

Chúc may mắn!