Muốn tạo hình ảnh AI cục bộ mạnh mẽ trên Windows? Sử dụng công cụ này

Tác giả Security+, T.Tư 22, 2024, 10:28:52 SÁNG

« Chủ đề trước - Chủ đề tiếp »

0 Thành viên và 1 Khách đang xem chủ đề.

Hướng dẫn này chỉ ra cách thiết lập tính năng tạo hình ảnh AI cục bộ trong Windows theo cách đơn giản nhất có thể.

  • Trình tạo hình ảnh AI cục bộ trên Windows là một cách miễn phí, không hạn chế và thú vị để thử nghiệm AI.
  • Fooocus, một chương trình Khuếch tán ổn định, rất dễ cài đặt trên Windows 10 và 11, giúp bất kỳ ai có máy tính đủ mạnh đều có thể truy cập vào việc tạo hình ảnh AI.
  • AI sáng tạo cũng là một công cụ năng suất mạnh mẽ và là một cách hay để tìm hiểu về công nghệ và lập trình.

Tạo hình ảnh AI bằng các công cụ trực tuyến như ChatGPT, DALL-E và MidJourney rất phổ biến, nhưng nếu bạn muốn tạo hình ảnh của riêng mình bằng AI, trên máy tính của riêng bạn mà không có bất kỳ hạn chế nào thì sao? Đây là cách dễ nhất để làm điều đó trên Windows.

1. Tại sao bạn muốn có trình tạo hình ảnh AI cục bộ của riêng mình?

Trình tạo hình ảnh AI trực tuyến cực kỳ mạnh mẽ và có thể rút ra từ lượng dữ liệu khổng lồ để xây dựng hình ảnh dựa trên lời nhắc của bạn (trong thế giới AI, lời nhắc là hướng dẫn bạn đưa ra cho AI), nhưng chúng có một số nhược điểm: đi kèm với phí hàng tháng, họ lưu giữ lịch sử tương tác của bạn và họ có thể hạn chế loại hình ảnh bạn có thể yêu cầu.

Việc tạo hình ảnh cục bộ chạy trên máy tính Windows của bạn là miễn phí (ngoài chi phí điện) và không có hạn chế nào. Bạn có thể thử nghiệm bất kỳ lời nhắc hình ảnh nào bạn có thể nghĩ ra và sử dụng các mô hình do cộng đồng tạo ra để tạo nội dung độc đáo. Đây là phần giới thiệu thú vị về không gian AI mới nổi và cũng có thể giúp bạn phát triển các kỹ năng CNTT và lập trình khác.

2. Cách thiết lập tạo hình ảnh khuếch tán ổn định trên Windows

Fooocus là một chương trình tạo hình ảnh được xây dựng bằng cách sử dụng Stable Diffusion. Nó miễn phí 100% và là nguồn mở, chạy ngoại tuyến và cung cấp trình tạo hình ảnh AI sẵn dùng "chỉ hoạt động" — khi bạn đã thiết lập và chạy nó, bạn có thể bắt đầu nhắc nó bằng ý tưởng của mình và nhận được (gần như) kết quả ngay lập tức.

Hầu hết các công cụ tạo hình ảnh AI và Khuếch tán ổn định khác dành cho Windows đều khó thiết lập, với các bước cài đặt phức tạp thường đòi hỏi phải làm quen với chương trình cơ bản. Fooocus tương đối đơn giản để thiết lập: tất cả những gì bạn cần là một máy tính hỗ trợ Docker chạy qua Windows Subsystem for Linux (WSL) và một GPU khiêm tốn (Fooocus yêu cầu card đồ họa NVIDIA 4GB để chạy).

Điều đáng chú ý là các bước này cũng hoạt động trên Linux. Bạn có thể bỏ qua các bước dành riêng cho WSL bên dưới và chỉ cần cài đặt Docker Desktop và sử dụng thiết bị đầu cuối Linux thay vì ứng dụng Windows Terminal. Nếu bạn là người dùng MacOS, hãy xem DiffusionBee, nơi cung cấp khả năng tạo hình ảnh được sắp xếp hợp lý, tương tự với Khuếch tán ổn định được gói trong ứng dụng riêng của nó.

Bước 1: Cài đặt Docker Desktop và Windows Terminal

Docker là phần mềm cho phép bạn chạy 'container', là những môi trường biệt lập có thể chứa tất cả các phần phụ thuộc và bộ phận chuyển động của một phần mềm. Chúng hơi giống một máy ảo nhưng có ít chi phí hoạt động hơn. Để cài đặt Docker, hãy tải xuống và cài đặt Docker Desktop cho Windows.

Docker có thể chạy trên Windows 10 và 11 ở chế độ WSL hoặc Hyper-V. Vì Fooocus chỉ hỗ trợ WSL nên trước tiên bạn cần bật WSL. Bạn cũng cần cài đặt ứng dụng Windows Terminal trước khi tiếp tục.

Bước 2: Tải xuống Fooocus

Để tải xuống Fooocus, bạn cần truy cập trang Github của họ và sau đó nhấp vào nút "Mã" màu xanh lá cây, sau đó là "Tải xuống ZIP". GitHub không phải là trang web thân thiện với người dùng nhất (chủ yếu được các nhà phát triển sử dụng để chia sẻ mã với nhau), vì vậy ảnh chụp màn hình bên dưới hiển thị vị trí tìm nút.


Khi tệp .zip tải xuống xong, hãy giải nén nó vào thư mục riêng và mở thư mục chứa các tệp Fooocus đã giải nén.

Bước 3: Khởi chạy Fooocus

Tiếp theo, nhấp chuột phải vào chỗ trống trong thư mục Fooocus và nhấp vào "Mở trong Terminal". Điều này sẽ mở một cửa sổ terminal Powershell.


Đảm bảo Docker Desktop đang chạy, sau đó gõ lệnh docker sau:

Mã nguồn [Chọn]
docker compose up -d
Lệnh này thực hiện như sau:

  • Chạy chương trình soạn thảo docker, được sử dụng để quản lý các ứng dụng Docker
  • Khởi động container bằng cách đưa nó lên
  • Yêu cầu container chạy ở chế độ nền (-d cho chế độ tách rời)


Nếu trước đây bạn chưa chạy Fooocus với Docker, nó sẽ tự động xây dựng ứng dụng Docker dựa trên mã Fooocus trong thư mục. Quá trình này có thể mất khá nhiều thời gian trên một số máy tính, vì vậy hãy kiên nhẫn và uống một ly cà phê (hoặc ăn trưa thật lâu) trong khi chờ đợi.

Khi hoàn tất, bạn sẽ thấy ứng dụng Fooocus đã được tạo và khởi động.


Bạn cũng sẽ có thể thấy bộ chứa Fooocus đang chạy trong Docker Desktop.


Từ Docker Desktop, bạn có thể dừng và khởi động Fooocus (mà không cần phải sử dụng thiết bị đầu cuối) hoặc xóa vùng chứa và tất cả dữ liệu của nó.

Bước 4: Tạo một số hình ảnh!

Bây giờ Fooocus đã hoạt động và chạy trong Docker, bạn có thể truy cập nó từ trình duyệt web của mình. Theo mặc định, nó chạy trên cổng 7865 và có thể được truy cập tại địa chỉ   Đăng nhập để xem liên kết (" localhost " là địa chỉ mà máy tính của bạn sử dụng để truy cập chính nó). Bạn có thể nhấp vào một container đang chạy trong giao diện Docker Desktop để xem cổng nào trên localhost có thể được sử dụng để truy cập vào nó.

Khi giao diện Fooocus đã tải xong, bạn chỉ cần yêu cầu nó tạo một số hình ảnh!


Hình ảnh đầu tiên có thể mất nhiều thời gian hơn những hình ảnh khác trong khi chuẩn bị các mô hình mà Fooocus sử dụng. Dưới đây là ví dụ về hình ảnh được tạo bằng lời nhắc Fooocus đơn giản: ảnh chụp một người hướng dẫn sử dụng hữu ích đang lướt mạng.


Nếu bạn muốn điều chỉnh hành vi hoặc thử các kiểu khác nhau hoặc xem lịch sử hình ảnh bạn đã tạo, hãy nhấp vào hộp kiểm "Nâng cao". Fooocus có rất nhiều tùy chọn và thậm chí bạn có thể sử dụng các mô hình do cộng đồng xây dựng từ các trang web như CivitAI.

Có một số nội dung NSFW trên CivitAI.

3. AI là một bộ công cụ hoàn toàn mới để giải trí, học tập và tăng năng suất!

AI sáng tạo có thể tạo văn bản, hình ảnh và video dựa trên yêu cầu của bạn. Đó là một bộ công cụ hoàn toàn mới mà bạn có thể sử dụng để giải trí, học tập và làm việc hiệu quả. Đây cũng là một cách hay để bắt đầu lập trình, chẳng hạn như sử dụng Stable Diffusion với Python để tạo hình ảnh.