Này Google, tôi vẫn không tin tưởng AI của Gemini sẽ thực hiện nhiệm vụ

Tác giả AI+, T.Năm 15, 2024, 01:03:32 CHIỀU

« Chủ đề trước - Chủ đề tiếp »

0 Thành viên và 1 Khách đang xem chủ đề.

AI sáng tạo chưa sẵn sàng đảm nhận các nhiệm vụ trong đời thực.

  • Google đặt mục tiêu thúc đẩy AI sáng tạo làm trợ lý ảo cho nhiều nhiệm vụ khác nhau nhưng công nghệ hiện tại còn nhiều hạn chế.
  • Google đã chứng minh việc sử dụng Gemini để so sánh giá thầu của nhà thầu sửa chữa nhà và các nhiệm vụ khác.
  • Gemini và các công cụ AI tổng hợp khác không có khả năng suy luận và logic giống con người.


Hôm nay, Google đã có rất nhiều tính năng AI để nói đến tại Google I/O, được cho là có khả năng thực hiện mọi thứ, từ giải các bài toán đến quản lý việc sửa chữa nhà cửa. Càng xem bài thuyết trình, tôi càng tự hỏi: làm sao bạn có thể tin tưởng AI cho những nhiệm vụ này?

Làn sóng mô hình và chatbot AI tổng hợp đầu tiên gần như tập trung hoàn toàn vào việc phân tích cú pháp và tạo văn bản. Bạn có thể yêu cầu ChatGPT viết một bài thơ được cá nhân hóa hoặc tóm tắt một cuốn tiểu thuyết viễn tưởng cổ điển hoặc viết một số mã JavaScript hoặc C++. Điều đó cũng mở rộng sang các định dạng phương tiện khác nhau, như hình ảnh và video. AI sáng tạo vẫn không phải là công cụ hoàn hảo cho nhiều trường hợp sử dụng đó, nhưng nó chắc chắn có thể hữu ích.

Google hiện đang cố gắng thúc đẩy AI sáng tạo trở thành một trợ lý ảo hoàn thiện hơn, có khả năng hoàn thành một số nhiệm vụ với sự can thiệp tối thiểu hoặc không cần sự can thiệp của con người. Trợ lý Google, Siri và các trợ lý ảo trước đó khác có thể xử lý một số tác vụ cơ bản, như tìm nhà hàng gần đó và bắt đầu chỉ đường điều hướng. Google muốn đẩy mạnh điều đó hơn nữa với công nghệ Gemini AI của mình, đảm nhận các nhiệm vụ thường yêu cầu con người tổng quan và xử lý logic.

1. Khi tóm tắt sai

Đã có rất nhiều buổi trình diễn tính năng AI trên sân khấu tại Google I/O, nhưng quan trọng là hầu hết chúng đều được ghi hình trước hoặc mô phỏng. Gemini tóm tắt tất cả các email gần đây trong Gmail từ một trường học cụ thể. Nó cũng tạo bản tóm tắt cuộc họp sau khi phân tích cú pháp bản ghi âm của cuộc gọi. Đó là những trường hợp sử dụng tương tự mà Microsoft đã quảng bá cho trợ lý Copilot của mình và mặc dù phần tóm tắt cơ bản có ít bước có thể sai sót hơn nhưng tôi vẫn lo lắng về việc sử dụng nó cho các cuộc họp hoặc tin nhắn quan trọng. Điều gì sẽ xảy ra khi Song Tử nghe nhầm ý kiến từ sếp của bạn về dự án nào nên được ưu tiên?

Google cũng thể hiện tầm nhìn của mình đối với "Đại lý", được mô tả là những người trợ giúp được hỗ trợ bởi AI, có thể "suy nghĩ trước nhiều bước" và "làm việc trên các phần mềm và hệ thống". Ví dụ đầu tiên là yêu cầu Gemini giúp trả lại một đôi giày được đặt hàng trực tuyến—AI đã tìm thấy nhãn vận chuyển, liên hệ với Converse để bắt đầu trả lại và tạo một sự kiện lịch để nhận gói hàng với UPS. Một ví dụ khác liên quan đến việc hỏi Song Tử, "Tôi mới chuyển đến Chicago, tôi có nên nghĩ đến điều gì không?" Gemini sau đó đề xuất cập nhật địa chỉ của người dùng trong các dịch vụ khác nhau và nó tự động hoàn thành nhiệm vụ trong tài khoản DoorDash của họ sau một xác nhận đơn giản.

Bản demo khiến tôi sốc nhất là phân đoạn về cách sử dụng Gemini trong Gmail. Người trong ví dụ cần sửa lại mái nhà và họ yêu cầu Gemini tìm và tổng hợp ba giá thầu được gửi đến địa chỉ email của họ. Người này quyết định chọn nhà thầu nào hoàn toàn dựa trên bản tóm tắt, sau đó gửi email trả lời cũng do AI tạo.


Báo giá sửa chữa trong email ví dụ dao động từ $875 đến $1500. Nếu Song Tử sai một chi tiết hoặc không đưa một số thông tin quan trọng vào bản tóm tắt thì đó có thể là một sai lầm cực kỳ đắt giá. Tôi không thể tưởng tượng được việc sử dụng sự hỗ trợ của AI để đưa ra quyết định như vậy. Tôi rất có thể mắc sai lầm trong tình huống tương tự, chẳng hạn như quên đọc một tin nhắn trong chuỗi email hoặc nhầm lẫn các số điện thoại, nhưng ít nhất đó sẽ là lỗi của chính tôi. Song Tử tiến bộ như thế nào?

Google sẽ không chi trả chi phí cho mái nhà bị hỏng của tôi vì Gemini đã đọc nhầm một email. Nó cũng sẽ không hoàn lại tiền cho tôi khi gửi đôi giày trả lại của tôi đến sai địa chỉ. Google đã hứa sẽ trả phí pháp lý khi các công cụ AI của họ chắc chắn tạo ra nội dung quá gần với tài liệu có bản quyền, nhưng chỉ vậy thôi.

Tôi đã sử dụng các công cụ AI tổng quát trong năm qua để giúp tôi thực hiện công việc viết mã hoặc viết tập lệnh bash hoặc chuyển đổi dữ liệu giữa các định dạng. Cụm từ chính ở đây là "giúp tôi" vì tôi vẫn đang xem dữ liệu đầu vào và kiểm tra kết quả. Google ngày càng muốn AI sáng tạo đảm nhận hoàn toàn các nhiệm vụ và đó không phải là điều tôi cảm thấy thoải mái, với tình trạng công nghệ hiện tại.

Đã có những nỗ lực khác trong việc sử dụng AI tổng quát để hoàn thành các nhiệm vụ trong đời thực. OpenTable là một trong những plugin đầu tiên dành cho ChatGPT, có khả năng cho phép bạn đặt chỗ ăn tối thông qua chatbot AI. Bạn có thể tìm thấy một số báo cáo về việc điều đó không hoạt động, mặc dù không rõ liệu AI hoặc tích hợp API cơ bản có phải là nguyên nhân hay không.

2. Đừng tin nó

Google và nhiều công ty công nghệ khác muốn bán cho bạn ý tưởng rằng AI có thể tạo ra logic và đưa ra quyết định chính xác với đủ thông tin. AI sáng tạo không thể làm được điều đó. Hiện tại không có AI nào tồn tại có thể suy nghĩ như bạn, tôi hay bất kỳ con người nào khác. Đó là lý do tại sao Gemini, ChatGPT, Copilot và mọi trợ lý AI khác có thể viết chương trình nhưng vẫn thất bại ở các vấn đề logic cơ bản. Hôm nay, Gemini đã mắc lỗi trong video demo tại Google I/O và đây thậm chí không phải là lần đầu tiên điều đó xảy ra.

Tại sao tôi lại tin tưởng Song Tử đưa ra những quyết định tài chính quan trọng cho tôi hoặc bất kỳ nhiệm vụ thực tế nào khác? Việc tiết kiệm một vài giây hoặc vài phút với những công việc nhàm chán có thực sự xứng đáng với những vấn đề tiềm ẩn không? Ý tưởng rằng một chatbot không thể chơi tic-tac-toe bằng cách nào đó có thể tự động hóa cuộc sống của tôi không hề hấp dẫn chút nào, bất kể Google có hào hứng với nó đến mức nào.