Bing Chat AI hiện có thể hiểu hình ảnh của bạn

Tác giả sysadmin, T.Bảy 21, 2023, 09:31:28 SÁNG

« Chủ đề trước - Chủ đề tiếp »

0 Thành viên và 1 Khách đang xem chủ đề.

Bing Chat AI hiện có thể hiểu hình ảnh của bạn


Bing Chat hiện có các tính năng nhập hình ảnh của GPT-4. Bing Chat, ChatGPT và các công cụ AI tổng quát tương tự khác chủ yếu tập trung vào việc hiểu nội dung văn bản và đưa ra câu trả lời. Tuy nhiên, việc hiểu hình ảnh cũng cực kỳ hữu ích và đó là những gì Microsoft hiện đang triển khai cho Bing Chat AI của mình.


Trong một bài đăng trên blog gần đây, Microsoft đã công bố một tính năng mới cho Bing Chat, được gọi là Tìm kiếm trực quan. Với Tìm kiếm Trực quan, bạn có thể tải lên một hình ảnh hoặc chọn một hình ảnh hiện có trên web và Bing sẽ cố gắng hiểu hình ảnh đó và sử dụng ngữ cảnh đó trong phản hồi. Video demo của Microsoft (được nhúng bên dưới) cho thấy một người nào đó đang tải lên một mẫu mô phỏng vẽ tay của một biểu mẫu web và yêu cầu Bing tạo mã HTML và CSS để làm cho nó hoạt động.

Microsoft đã giải thích trong một bài đăng trên blog: "Cho dù bạn đang đi du lịch đến một thành phố mới trong kỳ nghỉ và hỏi về kiến trúc của một tòa nhà cụ thể hay đang ở nhà cố gắng nghĩ ra ý tưởng cho bữa trưa dựa trên những thứ bên trong tủ lạnh của mình, hãy tải hình ảnh lên Bing Chat và sử dụng nó để khai thác kiến thức của web nhằm giúp bạn có câu trả lời."

Phần mềm có thể phát hiện nội dung của hình ảnh không có gì mới. Google Lens đã có thể xác định người, động vật, thực vật, địa danh và các đối tượng khác trong ảnh kể từ năm 2017 và người tiền nhiệm hạn chế hơn của nó là Google Goggles có từ năm 2010. Microsoft đang sử dụng các tính năng phát hiện hình ảnh của GPT-4, đây là mô hình ngôn ngữ tương tự được phiên bản cao cấp của ChatGPT sử dụng. Tuy nhiên, đầu vào hình ảnh chưa khả dụng trong ChatGPT, vì vậy đây là lần đầu tiên chúng tôi thấy tính năng đó được phổ biến rộng rãi.


Tôi đã thử Tìm kiếm bằng hình ảnh với một vài bức ảnh và kết quả thật ấn tượng. Yêu cầu Bing mô tả hình ảnh sẽ cung cấp cho bạn phản hồi chi tiết hơn nhiều so với những gì bạn nhận được từ Google Ống kính. Ví dụ: khi tải lên một bức ảnh về chú chó của tôi, câu trả lời sẽ là: "Đây là ảnh một chú chó màu đen và rám nắng đang ngồi trên một tấm thảm lông màu nâu. Chú chó đeo vòng cổ màu đỏ có gắn thẻ bạc. Chú chó đang nhìn lên máy ảnh với đôi tai vểnh lên. Hậu cảnh là một chiếc ghế dài màu trắng với những chiếc gối màu xanh và trắng. Ảnh được chụp từ một góc cao". Nó cũng giải thích chính xác rằng hình ảnh đã được tải lên ở dạng nghiêng.

Bạn có thể dùng thử tính năng này bằng cách mở Bing Chat trong Microsoft Edge (Microsoft vẫn chặn tính năng này trong các trình duyệt khác) và nhấp vào biểu tượng đường viền máy ảnh trong trường văn bản.