AI vẫn ở đây, vì vậy hãy cập nhật bản thân với 7 thuật ngữ AI này

Tác giả ChatGPT, T.Tám 10, 2024, 01:44:02 CHIỀU

« Chủ đề trước - Chủ đề tiếp »

0 Thành viên và 1 Khách đang xem chủ đề.

Biết những đứa trẻ tuyệt vời có ý nghĩa gì khi nói "LLM".AI đang tiến bộ với tốc độ chóng mặt. Nếu bạn muốn theo kịp thời đại, điều quan trọng là bạn phải biết thuật ngữ được các công ty AI và nhà tiếp thị sử dụng. Dưới đây là bảy thuật ngữ AI thường được sử dụng trong diễn ngôn hàng ngày để giúp bạn trở thành một người tham gia có hiểu biết.


1. Trí tuệ nhân tạo (AI) so với AGI (Trí tuệ tổng hợp nhân tạo)

Các công ty AI thường nói về việc đạt được AGI. Nó là gì và nó khác với AI ngày nay như thế nào?

Định nghĩa trong sách giáo khoa về AI là hệ thống máy tính có thể thực hiện các nhiệm vụ đòi hỏi trí thông minh giống con người. Tuy nhiên, các công cụ AI hiện tại chưa đáp ứng đầy đủ định nghĩa này. Chúng chỉ thể hiện thoáng qua trí thông minh giống con người, tập trung vào các nhiệm vụ cụ thể.

Ví dụ: ChatGPT có thể viết văn bản, mã và tạo hình ảnh bằng DALL-E. Nhưng nó không thể tạo ra âm nhạc. Udio có thể tạo nhạc nhưng không thể viết văn bản. Nó thực sự sử dụng GPT-4o cho lời bài hát. AI thực sự phải làm được tất cả những điều này và hơn thế nữa, giống như con người có thể làm được.

Đây là lúc AGI xuất hiện. AGI đề cập đến các máy tính có thể hiển thị trí thông minh giống con người trong nhiều nhiệm vụ. Tương tác với AGI sẽ giống như nói chuyện với Commander Data từ Star Trek.

Điều đó có nghĩa là, mặc dù chúng tôi biết AGI nên làm gì nhưng chúng tôi không biết nó sẽ hoạt động như thế nào. Hầu hết các nhà nghiên cứu AI, bao gồm cả Giám đốc AI của Meta, đều nghĩ rằng AGI phải mất hàng thập kỷ nữa mới có được.

2. Ảo giác AI

ver đã hỏi ChatGPT một câu hỏi và nhận được câu trả lời nghe có vẻ hoàn hảo—cho đến khi bạn nhận ra đó là sự bịa đặt? Đó là ảo giác AI.

Hệ thống AI đôi khi tạo ra thông tin sai lệch với độ tin cậy ở cấp độ chuyên gia. Họ có thể cho rằng Shakespeare đã viết "The Great Gatsby" một cách thuyết phục đến mức bạn gần như tin vào điều đó.

Những sự cố này thường xảy ra khi ChatGPT ra mắt lần đầu cùng với GPT-3.5. Ảo giác đã giảm với GPT-4 và GPT-4o, nhưng chúng vẫn xảy ra. Nhưng tại sao?

Chà, các mô hình AI không hiểu thông tin như chúng ta. Họ dự đoán các từ dựa trên các mẫu đã học. Điều này tạo ra các câu hợp lý, đúng ngữ pháp. Tuy nhiên, đôi khi họ có thể bịa đặt dữ liệu và sự kiện.

Các nhà nghiên cứu đang nỗ lực giảm ảo giác, nhưng đó vẫn là một vấn đề. Như hiện tại, cách bảo vệ tốt nhất chống lại ảo giác là bạn. Luôn thực hiện thẩm định khi sử dụng AI và kiểm tra kỹ mọi thông tin mà nó tạo ra, đặc biệt là khi nó nghe có vẻ quá hay hoặc kỳ lạ đến mức khó tin.

3. Mạng lưới thần kinh

Mạng lưới thần kinh là hệ thống máy tính lấy cảm hứng từ việc tổ chức các tế bào thần kinh trong não động vật—do đó có tên như vậy. Ý tưởng là tạo ra các mô hình tính toán có thể xử lý thông tin và học theo những cách lấy cảm hứng từ (không nhất thiết phải giống hệt) các hệ thống thần kinh sinh học.

Trong não người, các tế bào thần kinh kết nối theo những mô hình phức tạp. Sự kích hoạt của chúng ảnh hưởng đến ký ức, suy nghĩ và hành động của chúng ta. Trong mạng lưới thần kinh, các nơ-ron nhân tạo (nút) nhận đầu vào, xử lý chúng và gửi đầu ra. Các nút này kết nối theo mô hình phức tạp. Cấu trúc kết quả cho phép hệ thống thực hiện một loạt các nhiệm vụ đòi hỏi trí thông minh ở cấp độ con người.

Các ứng dụng của mạng lưới thần kinh bao gồm nhận dạng hình ảnh và giọng nói, phương tiện tự hành, dự báo tài chính và xử lý ngôn ngữ tự nhiên, cho phép máy tính hiểu và tạo ra ngôn ngữ của con người.

Điều đó nói lên rằng, mạng lưới thần kinh, đặc biệt là những mạng được thiết kế cho khối lượng công việc phức tạp, yêu cầu nhiều dữ liệu đào tạo chất lượng cao để tìm hiểu các mẫu và xử lý các tình huống mới. Điều này có thể là một thách thức để có được.

Ngoài ra, một số mạng lưới thần kinh—đặc biệt là các mô hình học sâu (sẽ nói thêm về điều đó trong phần tiếp theo)—rất khó diễn giải. Hiểu cách họ đi đến kết luận có thể khó khăn. Đây là vấn đề về hộp đen. Các nhà nghiên cứu đang nghiên cứu các mô hình và cách thức dễ hiểu hơn để giải thích các quyết định của AI.

4. Học máy và học sâu

Machine Learning (ML) và Deep Learning (DL) là hai trong số những từ thông dụng nhất trong giới công nghệ. Mặc dù một số người cho rằng Machine Learning và Deep Learning giống nhau, nhưng có một sự khác biệt nhỏ nhưng quan trọng cần lưu ý.

Học máy là một lĩnh vực rộng hơn trong khoa học máy tính, nơi bạn cung cấp cho máy tính nhiều dữ liệu để tự tìm ra các mẫu. Điều này trái ngược với lập trình truyền thống, nơi các nhà phát triển cần mã hóa mọi tương tác có thể có với người dùng.

Các chương trình ML không cần nhiều sự can thiệp như vậy và có thể tạo ra kết quả đầu ra bằng cách tham chiếu các mẫu trong dữ liệu huấn luyện—ngay cả khi bạn trình bày nó với một tình huống duy nhất không có trong dữ liệu huấn luyện. Điều đó có nghĩa là họ cần sự hướng dẫn của con người trong quá trình đào tạo để đảm bảo họ đi đúng hướng. Chúng tôi thấy một số ứng dụng của hệ thống ML trong việc phát hiện thư rác, đề xuất sản phẩm và dự báo thời tiết.

Giờ đây, Deep Learning là một tập hợp con của machine learning sử dụng mạng thần kinh nhiều lớp—do đó có tên là "Deep". Nó cần ít đầu vào của con người hơn ML truyền thống. Đầu vào của con người chủ yếu tham gia vào các giai đoạn đầu, như thiết kế mô hình cơ sở.

Bạn có thể sử dụng Deep Learning để tìm các mẫu trong dữ liệu thô mà không cần nhiều sự trợ giúp của con người. Thật tuyệt vời khi xử lý dữ liệu phức tạp như hình ảnh hoặc văn bản. Nó thúc đẩy các tác vụ điện toán nâng cao như nhận dạng hình ảnh và khuôn mặt, xử lý giọng nói và xe tự hành. Tuy nhiên, để thực hiện được điều này, các mô hình DL yêu cầu bộ dữ liệu huấn luyện khổng lồ và nhiều sức mạnh tính toán.

5. Xử lý ngôn ngữ tự nhiên (NLP)

NLP là một lĩnh vực nghiên cứu về khoa học máy tính liên quan đến việc giúp máy tính hiểu, giải thích và tạo ra ngôn ngữ của con người. Nhiệm vụ NLP hiện đại sử dụng Deep Learning để đạt được kết quả ấn tượng.

Một số ví dụ về nhiệm vụ sức mạnh của NLP bao gồm nhận dạng giọng nói, chuyển văn bản thành giọng nói, phân tích cảm xúc, phát hiện lời châm biếm, chuyển kiểu văn bản, v.v.

NLP là xương sống của công nghệ đàm thoại như Alexa, Siri và các chatbot AI khác. Nó cũng giúp dịch thuật, kiểm duyệt nội dung và nội dung được tạo tự động. Những tiến bộ gần đây của NLP đã làm cho lối viết của AI giống con người hơn. Đó là lý do tại sao ChatGPT nghe có vẻ rất tự nhiên.

6. Mô hình máy biến áp

Các mô hình máy biến áp là một công cụ mang tính cách mạng gần đây trong không gian AI. Ý tưởng về máy biến áp đã được các nhà nghiên cứu tại Google Brain đề xuất trong một bài báo năm 2017 có tiêu đề " Sự chú ý là tất cả những gì bạn cần ".

Các mô hình máy biến áp về cơ bản là một kiến trúc mạng lưới thần kinh được sử dụng để xử lý ngôn ngữ tự nhiên. Khái niệm cơ bản trước tiên là phân tích nhiều loại thông tin đầu vào cùng một lúc (hoặc song song) và sau đó xác định những yếu tố nào phù hợp nhất—một quá trình được gọi là "tự chú ý".

Bạn có thể hình dung nó giống như một người đọc siêu hiệu quả, người đọc ngay lập tức nhiều đoạn văn và rút ra ý nghĩa từ ngữ cảnh đầy đủ thay vì đọc từng đoạn một cách tuần tự, mỗi lần một từ.

Cơ chế tự chú ý này cho phép các mô hình Transformer hiểu rõ hơn đầu vào của con người và do đó tạo ra đầu ra tốt hơn. Nó đã cho phép khả năng dịch ngôn ngữ siêu tiên tiến, tóm tắt văn bản và tất nhiên là tạo văn bản.

Các mô hình máy biến áp là công nghệ đằng sau các công cụ mạnh mẽ như BERT của Google (Biểu diễn bộ mã hóa hai chiều từ máy biến áp) hoặc ChatGPT (Máy biến áp được đào tạo trước về tạo trò chuyện). Tuy nhiên, nó không chỉ tạo ra văn bản vì những công cụ này còn hữu ích cho việc nhận dạng giọng nói và thị giác máy tính.

7. Mô hình ngôn ngữ lớn

Mô hình ngôn ngữ lớn (LLM) là các mô hình Transformer mạnh mẽ được đào tạo trên các tập dữ liệu văn bản lớn. Chúng có hàng tỷ hoặc hàng nghìn tỷ tham số và chủ yếu tập trung vào khối lượng công việc theo ngôn ngữ cụ thể. ChatGPT, hay cụ thể là GPT, là một LLM. Claude, Gemini và Llama đều là những ví dụ về LLM.

Nhờ LLM, giờ đây chúng tôi có khả năng tạo văn bản, tóm tắt văn bản, dịch thuật, tạo mã, hiểu và thực thi nhiệm vụ ở cấp độ nâng cao, v.v.

LLM được đào tạo trên các bộ dữ liệu đa dạng trên quy mô internet mà không có hướng dẫn cụ thể. Họ tạo ra các mẫu và kết nối trong dữ liệu. Đôi khi, những mẫu này có thể sai, đó là khi con người bắt tay vào tinh chỉnh các mô hình cho các nhiệm vụ và ứng dụng cụ thể.

Hiện tại, một trong những thách thức chính với LLM là những lo ngại về đạo đức và khả năng xảy ra thông tin sai lệch. Vì tập dữ liệu huấn luyện có thể chứa thông tin sai lệch và sai lệch nên điều đó có thể được chuyển sang LLM. Đây thực sự là một trong những lý do khiến Trải nghiệm Sáng tạo Tìm kiếm của Google bắt đầu tạo ra thông tin sai lệch cho người dùng.

Bây giờ bạn đã được trang bị kiến thức về bảy thuật ngữ AI chính. Lần tới khi trò chuyện về tin tức mới nhất về AI, bạn sẽ có thể bỏ qua những thuật ngữ này như một người chuyên nghiệp. Chỉ cần nhớ, thế giới AI chuyển động rất nhanh, vì vậy hãy tiếp tục học hỏi và luôn tò mò!