Midjourney tại AI Art tốt như thế nào? Chúng tôi đã so sánh tất cả các mô hình

Tác giả sysadmin, T.Năm 13, 2023, 11:40:33 SÁNG

« Chủ đề trước - Chủ đề tiếp »

0 Thành viên và 1 Khách đang xem chủ đề.

Midjourney tại AI Art tốt như thế nào? Chúng tôi đã so sánh tất cả các mô hình


MidJourney được cho là công cụ tạo nghệ thuật AI dễ dàng nhất cả về cách sử dụng và về việc đạt được kết quả đáng kinh ngạc, nhưng thật dễ dàng để quên rằng nó không ấn tượng lắm khi ra mắt. Hãy xem nó đi được bao xa!


1. Phương pháp của chúng tôi

MidJourney hoạt động bằng cách chấp nhận "lời nhắc" văn bản mô tả loại hình ảnh bạn muốn nó tạo thông qua ứng dụng Discord. Nếu bạn muốn tìm hiểu cách sử dụng phần mềm, có rất nhiều hướng dẫn tuyệt vời về MidJourney  trên web sẽ giúp bạn thiết lập và chạy ngay lập tức. Đối với bài viết này, chúng tôi tập trung vào việc so sánh mức độ cải thiện của công nghệ MidJourney trong 15 tháng lẻ giữa V1 và V5.1, đây là bản mới nhất tính đến thời điểm viết bài này.

MidJourney cho phép bạn chuyển đổi thủ công giữa bất kỳ phiên bản mô hình nào của nó bằng cách sử dụng   /settingsphiên bản này sẽ cung cấp cho bạn các tùy chọn này.


Ở đây chúng ta có thể chọn giữa các phiên bản MidJourney khác nhau. Nhân tiện, các tùy chọn "Niji" là các mô hình được đào tạo đặc biệt để tạo ra các hình ảnh theo phong cách Anime và Manga Nhật Bản, vì vậy nếu đó là sở thích của bạn, hãy thử chúng.

Tất cả các hình ảnh được tạo cho bài viết này sẽ sử dụng cài đặt Chất lượng cao, với mức kiểu mặc định, xác định mức độ nghiêm ngặt hoặc lỏng lẻo của mô hình khi làm theo lời nhắc.

Chúng tôi sẽ sử dụng năm lời nhắc giống nhau với mọi kiểu máy để bạn có thể so sánh trực tiếp. Chúng tôi sẽ không sử dụng bất kỳ tham số MidJourney đặc biệt nào và sẽ tuân theo lời nhắc văn bản thuần túy bằng tiếng Anh đơn giản.

Chúng tôi đã sử dụng ChatGPT-4 để đưa ra năm lời nhắc thử nghiệm MidJourney, đại diện cho nhiều thử thách khác nhau. Đây là những lời nhắc chúng tôi đang sử dụng:

  • Tranh sơn dầu phong cảnh siêu thực
  • Hình ảnh một con phố sầm uất ở trung tâm thành phố vào những năm 1920
  • Khái niệm nghệ thuật của một thành phố tương lai vào ban đêm
  • Tranh hổ trắng trong tuyết
  • Chân dung người phụ nữ ngạc nhiên

MidJourney cung cấp bốn hình ảnh để đáp ứng với mỗi lời nhắc. Chúng tôi sẽ chọn một cái (theo ý kiến của chúng tôi) là tốt nhất trong số bốn cái được trình bày ở đây để so sánh. Vì vậy, hãy xem nó đã được cải thiện bao nhiêu trong thời gian ngắn.

2. Midjourney V1 (tháng 2 năm 2022)


Chúng tôi vững chắc trong lĩnh vực nhiên liệu ác mộng đẹp như mơ với V1 của MidJourney. Nhìn thoáng qua những hình ảnh này sẽ cho bạn  ấn tượng về bản chất của chúng, nhưng ngay khi bạn thực sự nhìn vào chúng, tất cả đều bị phá vỡ. Khuôn mặt con người đặc biệt đáng lo ngại.

3. MidJourney V2 (12 tháng 4 năm 2022)


V2 dường như không phải là một bước nhảy vọt so với V1, nhưng có một sự cải thiện nhất định về bố cục, đặc biệt đáng chú ý trong cảnh đường phố những năm 1920. Con hổ trắng chắc chắn có đường nét đẹp hơn trước và khuôn mặt của người phụ nữ bớt rùng rợn hơn bao giờ hết.

Lưu ý rằng, trong một số hình ảnh, có một loại chữ ký giả trên tác phẩm. Điều này là do AI đã học được rằng hình ảnh của một số phong cách nhất định có chữ ký và do đó, nó đã cố gắng tái tạo thứ gì đó giống với phong cách đó.

4. MidJourney V3 (25 tháng 7 năm 2022)


Với V3, chúng tôi chắc chắn sẽ thấy sự cải thiện đáng kể về tính nhất quán và bố cục. Các chi tiết rõ ràng mà không cần xem xét kỹ lưỡng, nhưng lượng nhiễu ngẫu nhiên chắc chắn đã giảm và hình ảnh có ý nghĩa hơn đối với mắt người.

5. MidJourney V4 (05/11/2022)


Bây giờ chúng ta nói chuyện! V4 cho thấy sự cải thiện đáng kể về bố cục, chi tiết cũng như mức độ sinh động và giàu trí tưởng tượng của hình ảnh. Chỉ hơn nửa năm kể từ phiên bản V1, và những hình ảnh này chắc chắn là có thể sử dụng được, thường là nguyên trạng mà không cần chỉnh sửa thêm. Cần phải xem xét kỹ lưỡng hơn nhiều để tìm ra các lỗi AI dễ nhận biết.

6. MidJourney V5 (15 tháng 3 năm 2023)


Những cải tiến với V5 tinh tế hơn một chút so với trước đây, nhưng chúng rất đáng kể. Ngoài cải tiến kỹ thuật về chi tiết và bố cục, những tác phẩm này có vẻ "giàu trí tưởng tượng" hơn, thậm chí còn năng động hơn, nhiều lựa chọn màu sắc hơn và trình bày tổng thể đẹp mắt hơn nhiều. Mặc dù V4 chắc chắn đã chuyển những hình ảnh thu được vào vùng xám giữa trình độ kỹ thuật tốt nhất của con người và những gì thế hệ AI có thể làm, nhưng V5 hầu như không thể nói rằng những hình ảnh này là do AI tạo ra khi MidJourney đang kích hoạt trên tất cả các trục.

V5 cũng đáng chú ý khi giải quyết một trong những vấn đề lớn nhất trong việc tạo hình ảnh AI: bàn tay!

Hình ảnh trên từ phiên bản V5 cho thấy vấn đề về cơ bản đã được giải quyết, mặc dù ở đây bạn vẫn có thể thấy rằng một trong các kim có thể bị thiếu ngón út hoặc chỉ đơn giản là nó bị che khuất. Những trường hợp cạnh như thế này vẫn còn tồn tại, nhưng có vẻ như thời của những người có bàn tay 7 ngón sắp kết thúc.

7. MidJourney V5.1 (03/05/2023)


Mặc dù bản cập nhật mô hình cuối cùng mà chúng tôi đang xem xét ở đây có thể chỉ là bản cập nhật ".1", nhưng chắc chắn không có gì nhầm lẫn về sự cải tiến. Dựa trên các nguyên tắc cơ bản của V5, V5.1 hoàn thiện những lỗi nhỏ trong V5 trong khi, theo quan điểm của chúng tôi, cho thấy sự cải thiện không thể nhầm lẫn về cách diễn đạt và sự tinh tế về mặt nghệ thuật tổng thể.

Thật khó để tưởng tượng MidJourney có thể đi đến đâu từ đây, nhưng mức độ tiến bộ cho đến nay thật đáng kinh ngạc và chúng tôi rất nóng lòng muốn xem điều gì có thể xảy ra tiếp theo.