GPT-4o có thể tô màu cho ảnh cũ không? Có thể, nhưng hãy cẩn thận!

Tác giả Starlink, T.Tư 16, 2025, 11:23:36 CHIỀU

« Chủ đề trước - Chủ đề tiếp »

0 Thành viên và 2 Khách đang xem chủ đề.

Làm tôi ngạc nhiên quá.

    Công nghệ tạo ảnh GPT-4o có thể tạo ra những bức ảnh hoàn hảo.
    Kết quả tô màu rất ấn tượng nhưng toàn bộ đều là hình ảnh chứ không phải màu sắc thực sự.
    Việc tô màu thực sự sẽ lưu giữ được lịch sử, trong khi việc tô màu do AI tạo ra lại không đạt yêu cầu.

DALL-E đã được thay thế bằng một công cụ tạo ảnh mới theo GPT-4o, và quả là một bước tiến lớn. Có vẻ như công nghệ tạo ảnh mới này có thể làm được rất ít, nhưng còn việc thêm màu vào ảnh đen trắng cũ thì sao?


Ý tưởng này nảy ra trong đầu tôi khi tôi đang xem một số bức ảnh lịch sử và phiên bản được tô màu công phu của chúng, vì vậy tôi quyết định xem phần mềm tạo hình ảnh tiên tiến này có thể thực hiện công việc này tốt như thế nào.

1. GPT-4o Image Generation có thể thực hiện phép lạ

Sự chuyển đổi từ DALL-E sang mô hình tạo ảnh GPT-4o mới là rất quan trọng. DALL-E có phong cách đặc trưng này làm hỏng mọi thứ ngay cả khi bạn muốn tạo ra hiệu ứng ảnh chân thực, nhưng mô hình mới này có thể tạo ra những bức ảnh gần như hoàn hảo. Hãy xem xét "bức ảnh" này về Albert Einstein đang làm việc trên MacBook.

Nếu bạn nhìn kỹ, có thể thấy một số lỗi rõ ràng, nhưng tôi nghĩ rằng ngoài sự bất hợp lý về mặt thời gian mà tôi đưa vào để làm rõ rằng đây không phải là ảnh thật, thì nó sẽ vượt qua bài kiểm tra đánh hơi đối với nhiều người.

Điều cũng gây ấn tượng với tôi vô cùng là cách hệ thống tạo hình ảnh tích hợp với chính ChatGPT. Vì ChatGPT có thể nhìn thấy và hiểu hình ảnh, bạn có thể sử dụng chúng để hướng dẫn quá trình tạo. Ví dụ, ở đây tôi cung cấp một hình ảnh mẫu và yêu cầu bot cho tôi biết Captain Picard của Star Trek trông như thế nào với kiểu tóc mullet.

Lưu ý rằng nó đủ thông minh để không tạo ra anh ta bằng một con cá, nhưng ngoài ra, kiến thức phần mềm về thế giới định hình lời nhắc (mà chúng ta không được thấy) và kết quả thật tuyệt vời. Quên phần tiền cảnh đi; hãy xem phần hậu cảnh và bố cục của hình ảnh gốc được mô phỏng gần như thế nào.

Vậy, tôi có thể đưa một bức ảnh đen trắng vào và yêu cầu nó cung cấp cho tôi phiên bản có màu không?

2. Kết quả của các yêu cầu tô màu thật ấn tượng

Tôi quyết định truy cập trang web của Thư viện Quốc hội và lấy một vài hình ảnh từ mục " Miễn phí sử dụng " để thử nghiệm. Tôi chọn một hình ảnh và yêu cầu ChatGPT tạo một bức ảnh được tô màu.

Những gì chúng ta nhận được là thứ trông khá ổn. Mặc dù, nó cũng đã biến mất và làm sạch hình ảnh, điều này không hoàn toàn là những gì tôi muốn. Vì vậy, tôi thường phải đưa ra yêu cầu tiếp theo để cố gắng giữ nguyên những khiếm khuyết ban đầu của hình ảnh và chỉ thêm màu vào đó. Tôi đã đưa một số bức ảnh vào hỗn hợp theo cách này và nhìn chung kết quả khá thuyết phục, nhưng chỉ là cái nhìn đầu tiên.

3. Nhưng hãy nhìn kỹ nhé!

Tuy nhiên, nếu bạn nhìn kỹ, hoặc đôi khi không nhìn kỹ lắm, thì rõ ràng đây không phải là ảnh tô màu của ảnh gốc, mà là ảnh hoàn toàn mới được tạo ra sao cho giống với ảnh gốc.


Rõ ràng, xét đến cách thức hoạt động của công nghệ này, điều đó không quá ngạc nhiên, nhưng trừ khi bức ảnh là của một người nổi tiếng như Lincoln hoặc Einstein, thì trình tạo hình ảnh không thể thực sự giữ được khuôn mặt của người gốc. Đôi khi nó làm tốt, nhưng tôi cá là một người thực sự biết người đó sẽ ngay lập tức nhận ra rằng có điều gì đó không ổn.

Ví dụ, tôi yêu cầu nó tô màu cho bức ảnh này của tôi, và tôi không biết anh chàng đó là ai!

4. Màu sắc thực tế giữ nguyên hình ảnh gốc

Ngày nay, những người thực hiện công việc tô màu thực sự có công việc dễ dàng hơn nhiều nhờ các công cụ kỹ thuật số, nhưng đó vẫn là một quá trình tỉ mỉ được thúc đẩy bởi chuyên môn lịch sử và nghiên cứu của họ về màu sắc nào có nhiều khả năng là màu chính xác nhất cho thời điểm và địa điểm đó.

Khi bạn đặt ảnh đã tô màu cạnh ảnh gốc, các bức ảnh trông giống hệt nhau, ngoại trừ màu sắc và các công đoạn chỉnh sửa khác. Lịch sử vừa được bảo tồn vừa được tái hiện. Hiện tại, mặc dù GPT-4o ấn tượng như một trình tạo hình ảnh, nhưng nó vẫn chưa thể làm được điều đó.

5. Không phù hợp với những bức ảnh quan trọng

Việc chơi đùa với việc tô màu, đặc biệt là đối với những bức ảnh có nhân vật lịch sử dễ nhận biết, khá thú vị. Tuy nhiên, thực tế là đây không phải là tô màu thực sự.

Vì vậy, nếu bạn có những bức ảnh cần tô màu, đặc biệt là ảnh gia đình, thì tôi khuyên bạn không nên thử sử dụng phương pháp này ngay. Tuy nhiên, có những dịch vụ AI trực tuyến được xây dựng cho công việc cụ thể này và tôi tò mò muốn xem liệu chúng có làm tốt hơn không. Hầu hết sẽ cho phép bạn tô màu một số hình ảnh miễn phí và đây là hình ảnh của tôi trông như thế nào sau khi được đưa qua trình tô màu của Deep AI.

Điều này đã làm rất tốt trong việc giữ nguyên bức ảnh gốc, nhưng thành thật mà nói, màu sắc trông không đẹp lắm và nó đã bỏ sót một vài điểm. Tôi cũng đã thử Palette, nó thực sự làm rất tốt, và đó là những gì tôi sẽ sử dụng nếu tôi có một số bức ảnh gia đình mà tôi cần chỉnh sửa.

Tôi thực sự hài lòng với điều đó, nhưng tôi cũng vẫn háo hức muốn xem những khả năng mạnh mẽ và tự do của các mẫu máy tương lai như trình tạo hình ảnh của GPT-4o có thể làm được điều mà các máy tô màu chuyên dụng này không làm được.