6 cách sử dụng đáng chú ý đối với tính năng nhận dạng hình ảnh của ChatGPT

Tác giả sysadmin, T.Mười 19, 2023, 11:51:26 SÁNG

« Chủ đề trước - Chủ đề tiếp »

0 Thành viên và 1 Khách đang xem chủ đề.

6 cách sử dụng đáng chú ý đối với tính năng nhận dạng hình ảnh của ChatGPT


Một bức tranh có giá trị hơn 1000 từ.

  • ChatGPT Plus hiện cho phép bạn tải lên hình ảnh để phân tích, cho phép xác định thực vật, động vật, v.v. bằng nhiều ảnh để thu hẹp kết quả.
  • ChatGPT có thể phân tích các sơ đồ phức tạp như sơ đồ hoặc trang trình bày, giải thích nội dung của chúng và trả lời các câu hỏi cụ thể.
  • Bạn có thể sử dụng ChatGPT để sắp xếp thông tin trong hình ảnh, chẳng hạn như liệt kê tên sách hoặc phim theo thứ tự bảng chữ cái, chứng tỏ đây là một công cụ hữu ích cho việc tổ chức và khả năng truy cập.


Người dùng ChatGPT Plus hiện có khả năng tải hình ảnh lên để chatbot AI phân tích. Với tất cả sự linh hoạt mà ChatGPT đã có, việc mang đến cho nó khả năng nhìn thế giới mang lại rất nhiều khả năng, bắt đầu từ những khả năng này.

1. Xác định đời sống thực vật và động vật (Và hầu hết mọi thứ)

Nếu bạn giống tôi và thích chụp ảnh thực vật và động vật thì ChatGPT giờ đây có thể giúp bạn xác định chúng, ít nhất là ở một mức độ nào đó. Tôi đã kiểm tra khả năng của nó bằng những bức ảnh tôi chụp về nhện và nhìn chung, nó có thể phân biệt chính xác loại nhện nói chung, nếu không muốn nói là loài cụ thể.


Ví dụ : điều thú vị về ChatGPT trong trường hợp này mà bạn không thể thực hiện với Google Lens là thu hẹp mọi thứ trên nhiều ảnh. Trong một số thử nghiệm của mình, tôi đã cung cấp thêm ảnh về cùng một con nhện trong suốt cuộc trò chuyện và ChatGPT dường như sử dụng thông tin bổ sung này để tiến gần hơn đến câu trả lời đúng.

2. Hiểu sơ đồ phức tạp

Nếu bạn được cung cấp một sơ đồ hoặc một bộ slide PowerPoint quá dày đặc và phức tạp thì bây giờ bạn có thể sử dụng ChatGPT để hiểu nó. Yêu cầu nó giải thích nội dung của hình ảnh cho bạn và trả lời bất kỳ câu hỏi cụ thể nào bạn có.

Ở đây, tôi đã lấy một sơ đồ tuyệt vời do Đại học Alberta tạo ra, trong đó mô tả liệu thứ gì đó có thuộc phạm vi công cộng theo luật Canada hay không. Sau đó, tôi yêu cầu ChatGPT sử dụng sơ đồ để xác định xem Alice in Wonderland có đủ điều kiện hay không.


Đây là thời điểm tốt để nhắc nhở mọi người rằng ChatGPT vẫn có xu hướng mắc sai lầm hoặc đơn giản là bịa ra mọi việc. Vì vậy, hãy kiểm tra kỹ các câu trả lời mà nó đưa ra cho bạn hoặc ít nhất hãy chạy cùng một phân tích nhiều lần trong các chuỗi trò chuyện riêng biệt để xem liệu bạn có nhận được kết quả nhất quán hay không.

3. Sắp xếp thông tin

Đây là hai điều thú vị tôi đã làm với ChatGPT và có ứng dụng rộng rãi. Đầu tiên, tôi chụp ảnh giá sách của mình và yêu cầu nó liệt kê tất cả các cuốn sách theo thứ tự bảng chữ cái. Nó đã làm rất tốt, với hạn chế chính là tính dễ đọc của văn bản trong ảnh, điều này phụ thuộc vào bạn với tư cách là nhiếp ảnh gia và máy ảnh của bạn tốt như thế nào.


Tiếp theo, tôi chụp ảnh kệ DVD/Blu-Ray của chúng tôi và yêu cầu ChatGPT liệt kê tất cả các tựa sách theo thứ tự bảng chữ cái. Nó đã thực hiện điều này với độ chính xác hoàn hảo, điều mà tôi nghi ngờ là nhờ việc chụp một bức ảnh dễ đọc hơn nhiều.


Bạn có thể đã nghĩ ra rất nhiều cách sử dụng cho việc này, nhưng điều ngay lập tức xuất hiện trong đầu tôi là tìm thấy những thứ trong bộ sưu tập vật lý của tôi. Ví dụ: tôi đã hỏi ChatGPT bản sao "Dune" của tôi ở đâu trong hình ảnh và nó hoạt động rất tốt, ngoại trừ việc nhầm phần trên cùng của giá sách là một trong các giá.


4. Tùy chọn trợ năng khác nhau

Kết hợp với khả năng trò chuyện thoại mới của ChatGPT trong ứng dụng di động, khả năng nhập hình ảnh của ChatGPT Plus đã biến nó thành một công cụ trợ năng mạnh mẽ. Vì bạn có thể chụp ảnh và gửi thẳng đến ChatGPT, sau đó sử dụng chế độ trò chuyện (bằng cách nhấn vào biểu tượng tai nghe để trò chuyện về hình ảnh. Vì vậy, nếu bạn gặp vấn đề về thị giác khiến bạn không thể phân tích cú pháp các cảnh phức tạp nhưng vẫn có thể đóng khung một bức ảnh, đây có thể là một yếu tố thay đổi cuộc chơi.


Nếu bạn sử dụng hình ảnh trên trang web của mình hoặc đăng hình ảnh trên các nền tảng truyền thông xã hội, bạn cũng có thể sử dụng tính năng mới này của ChatGPT để viết văn bản ALT phong phú và mang tính mô tả. Đây là văn bản mà trình đọc màn hình dành cho người dùng khiếm thị có thể sử dụng để cung cấp mô tả về hình ảnh. Phần lớn chúng được viết thủ công, ví dụ như cả Facebook và X (trước đây là Twitter) đều cho phép bạn thêm văn bản ALT vào hình ảnh bạn đăng. Nếu bạn quan tâm đến khả năng tiếp cận hoặc đối tượng khiếm thị, giờ đây bạn có thể sử dụng tính năng này của ChatGPT để viết nhanh mô tả văn bản ALT đa dạng thức và sau đó chỉ cần kiểm tra tính chính xác của nó.

5. Tạo lời nhắc hình ảnh AI từ hình ảnh

Việc đưa ra lời nhắc về các công cụ tạo hình ảnh AI như MidJourney của DALL-E khó hơn tưởng tượng. Chẳng hạn, mọi thứ đang trở nên tốt hơn với DALL-E 3 cung cấp khả năng hiểu rõ hơn nhiều về các lời nhắc bằng ngôn ngữ tự nhiên, đáp ứng chính xác những gì bạn yêu cầu, nhưng ngay cả khi đó thì không phải ai cũng chú ý đến chi tiết như vậy. Một điều thú vị bạn có thể làm với khả năng nhập hình ảnh của ChatGPT là yêu cầu nó đưa ra lời nhắc dựa trên hình ảnh bạn cung cấp. Vì vậy, nếu bạn thích một hình ảnh do AI tạo ra hoặc bất kỳ hình ảnh nào thực sự, bạn có thể yêu cầu nó viết lời nhắc phản ánh nội dung của hình ảnh và sử dụng nó làm điểm bắt đầu thay vì một trang trống.


6. Viết dựa trên hình ảnh AI

Chúng tôi có thể lật ngược mọi thứ và thay vì yêu cầu lời nhắc tạo hình ảnh, hãy yêu cầu ChatGPT sử dụng hình ảnh mà chúng tôi đã tạo bằng AI làm nguồn cảm hứng cho văn bản sáng tạo. Trong trường hợp này, tôi đã tạo ra một số tác phẩm nghệ thuật giả tưởng và sau đó yêu cầu ChatGPT đưa ra ý tưởng câu chuyện phù hợp với nó. Bạn có thể sử dụng điều này như một bàn đạp cho sự sáng tạo của riêng bạn.


7. Đỉnh của tảng băng trôi

Đây chỉ là một số trong những điều dễ hiểu nhất khi nói đến đầu vào trực quan trong ChatGPT. Tôi hy vọng trong những ngày và tuần tới, những người dùng sáng tạo sẽ nghĩ ra nhiều cách hơn nữa để giúp cuộc sống dễ dàng hơn hoặc giúp mọi người làm được nhiều việc hơn. Tất nhiên, chúng tôi cũng mong đợi một số mục đích sử dụng bất chính mới sẽ là một phần của điều đó, nhưng chỉ có thời gian mới trả lời được. Hiện tại, những người đam mê công nghệ đã có một món đồ chơi mới hấp dẫn để chơi.