Cách nâng cấp AI cho bất kỳ hình ảnh nào với Stable Diffusion

Tác giả sysadmin, T.Bảy 10, 2023, 08:40:44 SÁNG

« Chủ đề trước - Chủ đề tiếp »

0 Thành viên và 3 Khách đang xem chủ đề.

Cách nâng cấp AI cho bất kỳ hình ảnh nào với Stable Diffusion


  • Trong WebUI Stable Diffusion, hãy nhấp vào tab "Tiện ích bổ sung".
  • Tải lên hình ảnh hoặc hình ảnh bạn muốn nâng cấp.
  • Điều chỉnh thanh trượt Định cỡ lại để chọn độ phân giải bạn muốn.
  • Chọn một upscaler để sử dụng.
  • Nhấp vào "Tạo."

Thất vọng vì độ phân giải thấp của các sáng tạo Stable Diffusion của bạn? Hoặc có thể bạn có những bức ảnh "thật" cũ hơn mà bạn muốn nâng cấp? WebUI Stable Diffusion có các công cụ cho việc đó và chúng tôi sẽ hướng dẫn bạn qua quy trình đồng thời chia sẻ một số mẹo mà chúng tôi đã học được trong quá trình thực hiện.


Lưu ý: Trong hướng dẫn này, chúng tôi giả định rằng bạn đã cài đặt và chạy giao diện người dùng web Stable Diffusion của automatic11111. Đây là phiên bản cuối cùng của Stable Diffusion và giúp cho việc nâng cấp (cùng với nhiều khía cạnh khác của công việc với hình ảnh AI) đơn giản và trực quan hơn nhiều so với cài đặt Stable Diffusion tiêu chuẩn.

1. Cách nâng cấp hình ảnh trong Stable Diffusion

Cho dù bạn đã quét ảnh cũ, ảnh kỹ thuật số cũ hay ảnh do AI tạo ra có độ phân giải thấp, hãy bắt đầu Giao diện người dùng web Stable Diffusion và làm theo các bước bên dưới.

1.1. Tải lên một hình ảnh

Tất cả các công cụ nâng cấp của Stable Diffusion đều nằm trong tab "Extras", vì vậy hãy nhấp vào nó để mở menu nâng cấp.


Hoặc, nếu bạn vừa tạo một hình ảnh mà bạn muốn nâng cấp, hãy nhấp vào "Send to Extras" và bạn sẽ được đưa đến đó cùng với hình ảnh để nâng cấp. Nếu không, bạn có thể kéo và thả hình ảnh của mình vào trường Tải lên bổ sung.


Nếu bạn có nhiều hình ảnh muốn nâng cấp cùng một lúc, hãy chuyển sang tab "Quy trình xử lý hàng loạt" và thả nhiều hình ảnh cùng một lúc. Tuy nhiên, theo kinh nghiệm của tôi, điều này không phải lúc nào cũng hiệu quả và

1.2. Chọn kích thước

Sử dụng thanh trượt "Thay đổi kích thước" để điều chỉnh kích thước của hình ảnh đầu ra. Theo mặc định, bạn sẽ sử dụng tab "Scale By" cho phép bạn nhân độ phân giải hiện tại của hình ảnh với một số nhất định. Vì vậy, ví dụ: nếu bạn đặt thành 2 và hình ảnh đầu vào của bạn là 512×512, hình ảnh sẽ được nâng cấp lên 1024×1024.


Ngoài ra, bạn có thể chuyển sang tab "Scale To" và nhập độ phân giải cụ thể mà bạn muốn. Hãy chú ý đến tỷ lệ khung hình hiện tại của hình ảnh và bỏ chọn tùy chọn "Cắt cho vừa" nếu bạn không muốn các cạnh bị cắt.

Nếu bạn định tạo hình nền, hãy nhớ rằng hầu hết các điện thoại hiện đại sử dụng tỷ lệ khung hình 9:16, máy tính bảng sử dụng tỷ lệ 4:3 và máy tính là 16:9 (mặc dù màn hình siêu rộng lên tới 21:9).

1.3. Chọn một Upscaler

Bây giờ, đây là nơi bạn dễ cảm thấy choáng ngợp: bạn có sẵn một số thuật toán nâng cấp khác nhau tùy ý sử dụng, tất cả đều có tên khó hiểu và bạn phải chọn một thuật toán.

Cái bạn nên chọn cuối cùng phụ thuộc vào loại hình ảnh bạn đang nâng cấp, chẳng hạn như ảnh chụp, tranh vẽ, tác phẩm nghệ thuật anime hoặc một loại tác phẩm nghệ thuật theo phong cách "hoạt hình" khác. Các thuật toán khác nhau cũng hoạt động ở các tốc độ khác nhau, vì vậy nó cũng có thể phụ thuộc vào việc bạn đang vội như thế nào.


1.4. Công cụ nâng cấp Stable Diffusion nào là tốt nhất?

Thử nghiệm với các thuật toán khác nhau là cách duy nhất để biết chắc chắn chính xác bộ nâng cấp tích hợp của Stable Diffucion nào là tốt nhất cho trường hợp của bạn. Điều đó nói rằng, nếu bạn muốn một đề xuất cơ bản, đây thường là những lựa chọn tốt:

  • Ảnh: ESRGAN_4x
  • Tranh: R-ESRGAN 4x+
  • Anime: R-ESRGAN 4x+ Anime6B

1.5. Cao cấp!

Khi bạn đã có các cài đặt của mình, đã đến lúc nâng cấp. Nhấn nút "Tạo" lớn đó để bắt đầu quá trình.


Lần đầu tiên bạn nâng cấp với một thuật toán nhất định Stable Diffusion sẽ cần tải xuống các mô hình phù hợp, vì vậy, lần chạy đầu tiên sẽ mất thêm thời gian (điều này sẽ phụ thuộc một phần vào tốc độ kết nối của bạn).

Sau khi nâng cấp hoàn tất, bạn sẽ tìm thấy các hình ảnh đầu ra trong thư extras-imagesmục con của outputs thư mục của mình.

2. Mẹo để có kết quả nâng cấp tốt hơn

Nếu hình ảnh trông không giống như bạn mong đợi, bạn có thể thực hiện một số việc để có kết quả tốt hơn từ các công cụ nâng cấp của Stable Diffusion.

2.1. Hãy thử Combo cao cấp hơn

Để nâng cấp nâng cao, bạn có thể chọn thuật toán thứ hai sẽ áp dụng hiệu ứng của nó cho cùng một hình ảnh và kết quả của hai công cụ nâng cấp sẽ được trộn cho sản phẩm cuối cùng. (Nói rõ hơn, bộ nâng cấp thứ hai sẽ không tăng gấp đôi độ phân giải đầu ra.) Điều này hữu ích nếu bạn thấy hai bộ nâng cấp khác nhau tạo ra kết quả tốt hơn vì những lý do khác nhau.

Ví dụ: trong thử nghiệm của mình, tôi thấy ESRGAN_4x duy trì chi tiết tốt nhất, nhưng SwinIR có ít hạt hơn, đồng thời tạo ra một số tạo tác ô xếp khó chịu. Tôi có thể tận dụng tối đa cả hai thế giới bằng cách đặt ESRGAN_4x làm công cụ nâng cấp chính và SwinIR làm công cụ phụ, với khả năng hiển thị 0,5.


2.2. Khắc phục tỷ lệ khung hình xấu với Outpainting

Nếu bạn có một hình ảnh muốn sử dụng ở một tỷ lệ khung hình cụ thể nhưng hình ảnh được nâng cấp quá cao hoặc quá rộng để sử dụng mà không cắt xén, bạn có thể khắc phục sự cố đó bằng cách sử dụng công cụ "vẽ ngoài" của Stable Diffusion. Nó cho phép bạn tạo "thêm" hình ảnh, thêm hình ảnh vào các bên hoặc trên cùng và dưới cùng mà trước đây không có.

Để bắt đầu vẽ outpainting, hãy thả hình ảnh của bạn vào đầu vào img2img và tìm menu thả xuống "Script" và chọn Outpainting mk2 hoặc Poor Man's Outpainting. Điều chỉnh bất kỳ cài đặt nào bạn thấy cần thiết rồi nhấp vào "Tạo".

Như bạn sẽ nhanh chóng phát hiện ra, vẽ phác rất khó và có thể là một chủ đề cho một hướng dẫn khác, đặc biệt là với nội dung hình ảnh phức tạp như người và động vật. Điều đó nói rằng, chỉ cần loay hoay và không thực hiện quá nhiều thay đổi, tôi đã có thể tạo ra phiên bản toàn cảnh này cho hình ảnh của mình, thoạt nhìn có vẻ nửa tin nửa ngờ.


2.3. Khôi phục khuôn mặt bị méo bằng GPFGAN hoặc CodeFormer

Nếu có khuôn mặt của một người trong hình ảnh mà bạn đang phóng to, nó có thể dễ dàng bị biến dạng đến mức không thể nhận dạng được. Chắc chắn bạn cũng đã thấy một số màn tái hiện khuôn mặt người khá khủng khiếp của Stable Diffusion. Cả hai trường hợp đều xảy ra khi bạn muốn điều chỉnh  thanh trượt hiển thị GPFGAN  hoặc  CodeFormer. Mỗi người áp dụng một lớp chỉnh sửa khuôn mặt trong quá trình nâng cấp để khắc phục đôi mắt ma quái và những nếp nhăn kỳ quái đó.

Nếu bạn đang sử dụng CodeFormer, bạn cũng có thể điều chỉnh "trọng lượng" của hiệu ứng, điều này giống như kiểm soát mức độ mạnh của nó (trong khi thanh trượt khả năng hiển thị giống như điều chỉnh độ trong suốt của lớp hiệu chỉnh). Bạn càng tăng trọng lượng, CodeFormer sẽ càng cố gắng sửa. Điều này có thể cải thiện hoặc làm giảm chất lượng hình ảnh cuối cùng tùy thuộc vào tình huống. Bạn có thể phải trải qua một số thử nghiệm và sai sót để có được kết quả tốt nhất có thể.

2.4. GPFGAN so với CodeFormer để phục hồi khuôn mặt

Mặc dù cả hai đều là những công cụ có khả năng, GPFGAN nói chung tốt hơn trong việc khôi phục cấu trúc của khuôn mặt (đặc biệt là mắt), nhưng CodeFormer lại tốt hơn trong việc sửa kết cấu da. GPFGAN có xu hướng làm cho da người trông cực kỳ mịn màng, vì vậy nếu bạn nhận thấy điều đó xảy ra, hãy thử CodeFormer để thay thế. Ngoài ra, hãy kết hợp cả hai và cố gắng tận dụng tốt nhất cả hai thế giới. Một lần nữa, thử nghiệm là chìa khóa.


Về tốc độ, GPFGAN nhanh hơn một chút so với CodeFormer. Vì vậy, nếu bạn đang tìm cách nâng cấp diễn ra nhanh nhất có thể, có lẽ bạn sẽ muốn dựa vào GPFGAN.