Google cần tập trung hơn thay vì AI ở mọi nơi

Tác giả ChatGPT, T.Tám 22, 2024, 07:11:35 CHIỀU

« Chủ đề trước - Chủ đề tiếp »

0 Thành viên và 1 Khách đang xem chủ đề.

Đồng thời quá nhiều và gần như không đủ.   

  • Google đã giới thiệu các tính năng AI mới nhưng tập trung nhiều vào sự cường điệu hơn là nội dung và tính thực tế.
  • Gemini là mô hình sáng tạo mới của Google đảm nhận vai trò trợ lý mặc định trên điện thoại Android.
  • Mặc dù một số tính năng như Magic Editor và Call Notes có vẻ phô trương nhưng bảo mật dữ liệu vẫn là mối lo ngại chính đáng.


Google đã công bố các phiên bản mới nhất của hệ sinh thái AI đang phát triển của mình tại sự kiện Made by Google được tổ chức ở Mountain View vào thứ Ba, một tập hợp các tính năng tổng hợp mà bằng cách nào đó được quản lý đồng thời vừa quá nhiều vừa gần như không đủ.

Trong suốt sự kiện được phát trực tiếp kéo dài một giờ bốn mươi phút, rất nhiều giám đốc điều hành của Google đã lên sân khấu sự kiện để ca ngợi mô hình ngôn ngữ lớn Gemini và thể hiện năng lực biểu diễn của nó trong một loạt cuộc trình diễn trực tiếp— hầu hết trong số đó đã diễn ra mà không gặp trở ngại nào. Công ty đã đẩy mạnh thành tựu AI của mình lên hàng đầu, với Pixel 9, Pixel Buds 2 và Pixel Watch 3, chỉ ra mắt trong nửa sau của sự kiện. Điều này đánh dấu một sự đảo ngược hoàn toàn so với vài năm trước khi AI từng được đề cập đến thì nó chỉ xuất hiện trong các cuộc họp báo và sự kiện trực tiếp tập trung vào phần mềm theo truyền thống của Google.

Rick Osterloh, Phó chủ tịch cấp cao, Nền tảng & Thiết bị tại Google, nói với đám đông tập hợp: "Đó là trải nghiệm hoàn chỉnh từ đầu đến cuối mà chỉ Google mới có thể mang lại". "Trong nhiều năm, chúng tôi đã theo đuổi tầm nhìn về trợ lý AI di động mà bạn có thể làm việc cùng khi làm việc với trợ lý cá nhân ngoài đời thực, nhưng chúng tôi bị giới hạn bởi những giới hạn về những gì công nghệ hiện có có thể làm được."

Để vượt qua những giới hạn đó, "chúng tôi đã xây dựng lại hoàn toàn toàn bộ trải nghiệm hệ thống xung quanh các mô hình Gemini của mình," ông tiếp tục. "Hệ thống Song Tử mới có thể vượt ra ngoài việc hiểu lời nói của bạn để hiểu ý định của bạn và giao tiếp một cách tự nhiên hơn."

1. Google tập trung toàn lực vào AI sáng tạo

Google đang chạy đua với các đối thủ trong ngành như Apple, OpenAI, Microsoft, Amazon và Anthropic để duy trì vị trí dẫn đầu về AI của mình. Nó đã tích hợp chức năng tổng hợp của Gemini vào bộ ứng dụng Workspace, cho phép hệ thống máy học tận dụng dữ liệu người dùng (cụ thể là từ Google Tài liệu, Trang trình bày, Gmail, Drive và Trang tính) để đưa ra các phản hồi được cá nhân hóa. Người dùng có thể tạo văn bản và hình ảnh cho Google Tài liệu, tạo trang trình bày bằng ngôn ngữ tự nhiên hoặc tạo báo cáo trông chuyên nghiệp dựa trên bảng tính trong Trang tính.

Nhưng đây mới chỉ là khởi đầu cho tham vọng AI của Google. Tại sự kiện hôm thứ Ba, công ty đã công bố Gemini là người thay thế Google Assistant, biến nó thành trợ lý mặc định trên điện thoại Android. Động thái này phù hợp với quyết định của Apple nhằm nâng cao Siri bằng ChatGPT của OpenAI. Song Tử cung cấp một trợ lý thông minh và trò chuyện tốt hơn, có khả năng làm gián đoạn công việc mà không mất tập trung. Tính năng Gemini Live mới được giới thiệu cho phép tương tác trong thời gian thực với AI, giúp Google có thể cạnh tranh với Chế độ giọng nói nâng cao của OpenAI. Gemini cuối cùng cũng sẽ diễn giải nội dung màn hình điện thoại bằng tính năng lớp phủ sắp ra mắt.

2. Google vẫn đang thấy những gì dính vào

Tôi ước đó là phạm vi những gì Google đang làm. Tuy nhiên, như đã xảy ra kể từ khi ChatGPT ra mắt khoảng 18 tháng trước, các công ty công nghệ sẽ không ngừng cố gắng đưa AI vào bất kỳ và mọi sản phẩm họ tạo ra, bất kể liệu nó có thực sự mang lại giá trị cho trải nghiệm người dùng hay không.

Lấy tính năng Thêm tôi mới làm ví dụ. Nó cho phép bạn hợp nhất hai bức ảnh—một trong nhóm lớn hơn, bức còn lại của nhiếp ảnh gia đơn độc—thành một hình ảnh duy nhất. "Một trong những vấn đề lớn nhất với ảnh nhóm là làm thế nào để bao gồm toàn bộ nhóm vào một số thời điểm," Giám đốc sản phẩm Pixel, Shenaz Zack, cho biết trên sân khấu. "Cuối cùng, bạn đã chụp được một bức ảnh mà bạn cũng muốn có mặt. Tính năng Thêm tôi mới đã khắc phục điều đó để bạn có thể được đưa vào ảnh kỳ nghỉ của gia đình mình".

Bạn cũng có thể yêu cầu một người qua đường chụp nhanh một bức ảnh về bạn như mọi người đã làm kể từ khi máy ảnh ra đời hoặc sử dụng một trong những "chân máy" mới giúp giữ máy ảnh của bạn ở độ cao và hướng thích hợp và có thể nhấp vào từ xa. màn trập. Đồng thời, bạn đứng cùng với những người còn lại trong nhóm. So sánh việc chỉ chạy các truy vấn cơ bản bằng AI tiêu tốn nhiều tài nguyên với các tìm kiếm thông thường, tôi không hiểu làm thế nào Google có thể biện minh cho việc phát triển một tính năng giải quyết chính xác vấn đề gì—tương tác với người khác ở nơi công cộng? Mang theo gậy selfie? Đây chắc chắn là một ý tưởng tính năng thú vị và là một màn trình diễn hay về khả năng xử lý hình ảnh của AI, nhưng tôi cảm thấy khó tin rằng việc "đưa mọi người vào ảnh nhóm" lại là một vấn đề cấp bách trong thế giới thực đối với nhiều người dùng Google.

Magic Editor là một tính năng Android được cải tiến bằng AI dựa trên máy ảnh khác, ngày càng mang lại cảm giác phô trương. Trong ví dụ hôm thứ Ba, Kenny Sulaimon, Giám đốc sản phẩm máy ảnh Pixel của Google, đã hướng dẫn khán giả Made by Google thông qua đợt cập nhật mới nhất của tính năng này. Những bản cập nhật này sẽ cho phép bạn, với tư cách là chủ sở hữu Pixel 9, điều chỉnh lại ảnh, nhờ AI đề xuất các loại cắt tối ưu và mở rộng hình nền bằng cách sử dụng AI tổng hợp. Nó cũng cho phép bạn "hình dung lại" các khu vực và khía cạnh cụ thể của một bức ảnh, chẳng hạn như thay đổi cánh đồng cỏ thành cánh đồng hoa dại hoặc thêm các yếu tố bổ sung vào nền của bức ảnh.

AI liên tục được quảng cáo là một công nghệ mang tính cách mạng sẽ giúp chúng ta chữa khỏi những căn bệnh khó chữa, khám phá các cấu trúc protein và thuốc mới cũng như giải quyết những bí ẩn sâu sắc nhất của vũ trụ. Nhưng điều tốt nhất mà Google có thể làm là cung cấp cho công chúng một cách dễ dàng hơn để thêm khinh khí cầu do AI tạo ra vào các hình ảnh giống như chúng là clip art của thế kỷ 21. Thật là một người gyp.

Bạn có thể thấy những ý định tốt đằng sau cả tính năng Ảnh chụp màn hình Pixel và Ghi chú cuộc gọi mới. Cái trước sử dụng AI để xử lý ảnh chụp màn hình nhằm giúp bạn dễ dàng tìm thấy chúng sau này bằng cách sử dụng lời nhắc bằng văn bản và cái sau cung cấp cho bạn bản tóm tắt do AI tạo ra về các chủ đề và thông tin thích hợp nhất của cuộc gọi điện thoại. Tuy nhiên, những tác động tiềm tàng về quyền riêng tư của việc sử dụng chúng khiến tôi phải tạm dừng.

Ảnh chụp màn hình có nhiều điểm tương đồng với tính năng Microsoft Recall không còn tồn tại gần đây đã bị ngừng hoạt động trong bối cảnh người dùng phản đối kịch liệt về quyền riêng tư dữ liệu cá nhân — tuy nhiên, không giống như Recall, tính năng này chỉ nhập các hình ảnh do người dùng chụp trực tiếp và có thể được chuyển đổi theo cách thủ công. Người dùng Ghi chú cuộc gọi sẽ phải cấp cho Google quyền truy cập theo thời gian thực vào các cuộc gọi điện thoại của họ để tính năng này hoạt động. Điều này mở ra một nguồn dữ liệu cá nhân khác của bạn có thể (và có thể sẽ có lúc) bị rò rỉ trực tuyến. Có vẻ như ngành công nghiệp AI không có thành tích đặc biệt xuất sắc trong việc duy trì bảo mật dữ liệu.

3. Người tiêu dùng cần tập trung vào bảo mật dữ liệu hơn là mánh lới quảng cáo

Bạn có thể nghĩ rằng ngành này sẽ làm như vậy, dựa trên lượng dữ liệu của bạn cần để hoạt động ở mức độ như đã được thổi phồng. Từ các tính năng của người dùng cuối cho đến các mô hình ngôn ngữ lớn mà họ xây dựng trên nền tảng, các hệ thống AI ngày nay yêu cầu lượng dữ liệu khổng lồ, thường được lấy từ internet công cộng mà không được phép, để thực hiện các hoạt động suy luận của chúng với độ chính xác đủ cao.. Nhưng càng có nhiều dữ liệu mà các công ty siêu quy mô như Google, Microsoft hoặc AWS thu thập thì càng có nhiều khả năng dữ liệu đó bị người dùng trái phép truy cập, cho dù họ là nhân viên và nhà thầu của Google, tin tặc bên thứ ba hay nhân viên thực thi pháp luật.

Mặc dù tôi nghĩ rằng Google nhìn chung đang đi đúng hướng trong quá trình phát triển AI của mình, nhưng tôi không thể không nhận thấy tính chất phân tán của các tính năng được trình bày vào thứ Ba và cách mỗi tính năng cần quyền truy cập vào một phần dữ liệu cá nhân khác nhau của tôi. Tôi là người thích tích hợp Gemini với Workspace, nhưng có vẻ như Google vẫn đang ném các ý tưởng vào tường và xem mánh lới quảng cáo nào phù hợp nhất thay vì cố tình xây dựng các tính năng AI sẽ tạo ra sự thay đổi thực sự trong cuộc sống của mọi người. Có lẽ Dự án Astra sắp ra mắt của Google, cho phép AI sử dụng máy ảnh điện thoại của bạn để quan sát, phân tích và hiểu thế giới xung quanh, sẽ chứng tỏ là ứng dụng sát thủ mà ngành AI cần để giữ cho bong bóng của nó không bị vỡ.