ChatGPT là gì? Một người giải thích cơ bản

Tác giả sysadmin, T.Sáu 08, 2023, 02:57:00 CHIỀU

« Chủ đề trước - Chủ đề tiếp »

0 Thành viên và 1 Khách đang xem chủ đề.

ChatGPT là gì? Một người giải thích cơ bản


Vẫn còn bối rối bởi chatbot AI phổ biến nhất? Đây là mọi thứ bạn cần biết về ChatGPT. Vào tháng 11 năm 2022, phòng thí nghiệm trí tuệ nhân tạo OpenAI có trụ sở tại San Francisco đã phát hành ChatGPT, một chatbot AI nhanh chóng trở thành hiện tượng và thu hút sự quan tâm cũng như trí tưởng tượng của mọi người trên khắp thế giới. ChatGPT trở thành ứng dụng phát triển nhanh nhất trong lịch sử, đạt 100 triệu người dùng chỉ hai tháng sau khi ra mắt.


Rất nhiều hứa hẹn và mối quan tâm xoay quanh ChatGPT và các hệ thống AI tương tự, còn được gọi là "mô hình ngôn ngữ lớn" (LLM)—mạng thần kinh AI khổng lồ có thể xử lý và tạo văn bản giống con người. Mọi người đã đưa chatbot vào tất cả các loại mục đích sử dụng sáng tạo, bao gồm viết bài và email, thiết kế trang web và viết mã phần mềm. Tuy nhiên, đã có những lo ngại về việc sử dụng có khả năng bất chính, chẳng hạn như tạo điều kiện cho việc truyền bá thông tin sai lệch, lừa đảo qua email và cho phép học sinh gian lận trong các bài kiểm tra.

Đây là mọi thứ bạn cần biết về ChatGPT.

1. Công nghệ đằng sau ChatGPT là gì?

ChatGPT được cung cấp bởi mạng lưới thần kinh sâu. DNN là kiến trúc phần mềm được lấy cảm hứng từ cấu trúc của bộ não. Họ học cách thực hiện các nhiệm vụ bằng cách xử lý nhiều ví dụ và điều chỉnh các tham số của chúng để ước tính các mẫu phổ biến mà họ phát hiện qua các ví dụ đó.

Các LLM như ChatGPT và GPT-4 sử dụng kiến trúc mạng thần kinh đặc biệt được gọi là mạng biến áp, đặc biệt tốt trong việc học hỏi từ các chuỗi dữ liệu lớn, bao gồm văn bản, âm thanh, hình ảnh và thậm chí cả cấu trúc protein. LLM được đào tạo thông qua "dự đoán mã thông báo tiếp theo": Họ được cung cấp một khối lượng lớn văn bản được thu thập từ các nguồn khác nhau, chẳng hạn như Wikipedia, trang web tin tức và GitHub. Sau đó, văn bản được chia thành "các mã thông báo", về cơ bản là các phần của từ ("các từ" là một mã thông báo, "về cơ bản" là hai mã thông báo).


Mô hình lấy một đoạn văn bản (chẳng hạn như câu mở đầu của một bài viết trên Wikipedia) và cố gắng dự đoán mã thông báo tiếp theo trong chuỗi. Sau đó, nó so sánh đầu ra của nó với văn bản thực tế trong kho dữ liệu đào tạo và điều chỉnh các tham số của nó để sửa bất kỳ lỗi nào. Bằng cách thực hiện điều này lặp đi lặp lại trên một khối văn bản rất lớn, máy biến áp phát triển một mô hình ngôn ngữ có thể tạo ra các chuỗi văn bản mạch lạc khi được nhắc.

Tất cả các LLM dựa trên máy biến áp đều sử dụng dự đoán mã thông báo tiếp theo. Điều khiến ChatGPT trở nên đặc biệt là một bước đào tạo bổ sung có tên là "học tăng cường từ phản hồi của con người" ( RLHF ). Trong giai đoạn này, người đánh giá và người chú thích tạo lời nhắc và xếp hạng đầu ra của LLM. Sau đó, mô hình sẽ tinh chỉnh các tham số của nó để tạo ra kết quả đầu ra nhận được xếp hạng cao hơn. Điều này giúp ChatGPT tự điều chỉnh theo ý định của người dùng. RLHF là lý do mà ChatGPT đã trở nên hữu ích hơn rất nhiều so với những người tiền nhiệm của nó.

2. Làm cách nào tôi có thể dùng thử ChatGPT?


Bạn có thể đăng ký ChatGPT trên trang web của OpenAI ; nó cũng có thể truy cập được thông qua ứng dụng iOS. Phiên bản miễn phí của chatbot có dung lượng máy chủ hạn chế và có thể phản hồi chậm, tùy thuộc vào tải của máy chủ. Nó không có hỗ trợ khách hàng và dựa trên kiểu GPT-3.5 cũ hơn.

Phiên bản trả phí, ChatGPT Plus, có giá 20 đô la mỗi tháng. Nó cung cấp các phản hồi ưu tiên, có hỗ trợ khách hàng và dựa trên kiểu GPT-4 tiên tiến hơn, có bộ nhớ dài hơn so với phiên bản tiền nhiệm.

Bạn cũng có thể truy cập ChatGPT thông qua API của OpenAI, nơi bạn có thể thanh toán dựa trên số lượng mã thông báo bạn sử dụng.

Một cách khác để dùng thử ChatGPT là thông qua các dịch vụ của bên thứ ba. Một ví dụ là Poe , một ứng dụng có một số chatbot khác nhau, bao gồm ChatGPT.

3. Tôi có thể làm gì với ChatGPT?


Với hướng dẫn và ngữ cảnh phù hợp, ChatGPT có thể rất hữu ích. Dưới đây là một vài điều bạn có thể làm với ChatGPT.

  • Viết bài: ChatGPT có thể là một công cụ tốt để viết bài. Nếu bạn nhắc nó viết một bài báo đầy đủ trong một lượt, nó sẽ cho nhiều kết quả khác nhau. Nhưng nếu bạn làm việc với nó từng bước một, ChatGPT có thể làm được những điều ấn tượng. Ví dụ: bạn có thể bắt đầu với một dàn ý và hoàn thiện từng phần với sự trợ giúp của ChatGPT
  • Chỉnh sửa: ChatGPT là một trợ lý chỉnh sửa tuyệt vời. Bạn có thể sử dụng nó để chỉnh sửa bản sao, hiệu đính, viết lại, điều chỉnh phong cách, v.v.
  • Dịch: ChatGPT có thể dịch rất tốt bằng hàng tá ngôn ngữ. Nếu bạn đang làm việc trên một miền chuyên biệt, bạn có thể cải thiện bản dịch của miền đó bằng cách cung cấp cho miền đó ngữ cảnh, chẳng hạn như ví dụ về tài liệu bằng ngôn ngữ nguồn và ngôn ngữ đích.
  • Tóm tắt: ChatGPT có thể tóm tắt các bài báo, bài phát biểu và bài báo. Nó trở nên chính xác hơn khi bạn cung cấp các hướng dẫn, chẳng hạn như chủ đề nào cần làm nổi bật.
  • Động não các ý tưởng: ChatGPT có thể cung cấp tất cả các loại hỗ trợ tại đây, từ gợi ý các điểm thảo luận cho bài thuyết trình đến lập kế hoạch cho một chuyến đi.
  • Viết mã: ChatGPT là một trợ lý mã hóa rất tốt và biến các mô tả chức năng thành mã hoạt động trong hàng tá ngôn ngữ lập trình và tập lệnh.

4. Giới hạn của ChatGPT là gì?


Để tận dụng tốt nhất ChatGPT, bạn nên biết các giới hạn của nó.

  • Ảo giác: Các LLM chẳng hạn như ChatGPT có thể ghép văn bản đúng về mặt từ vựng nhưng sai về mặt thực tế. Điều này cũng áp dụng cho việc sử dụng ChatGPT để mã hóa: Nó có thể tạo mã không hoạt động hoặc không an toàn. Nguyên tắc chung của tôi là chỉ tin tưởng chatbot trong những tình huống mà tôi có thể xác minh đầu ra.
  • Thông tin cũ: Kiến thức của ChatGPT chỉ giới hạn ở dữ liệu được đào tạo. Tại thời điểm viết bài này, mô hình đã được đào tạo trên một kho văn bản được thu thập vào giữa năm 2021. Do đó, nó không thể trả lời các câu hỏi về các sự kiện gần đây. Một cách giải quyết khác là cung cấp cho nó ngữ cảnh. Ví dụ: bạn có thể sao chép và dán văn bản của một báo cáo tin tức gần đây trước lời nhắc của mình và hướng dẫn ChatGPT điều chỉnh đầu ra của nó trên văn bản của báo cáo. Các thành viên ChatGPT Plus cũng có thể khai thác thêm thông tin hiện tại với tích hợp Bing gần đây.
  • Giới hạn bộ nhớ: Mỗi mô hình ngôn ngữ có khoảng bộ nhớ giới hạn, được tính bằng mã thông báo. Điều này có nghĩa là khi lịch sử trò chuyện của bạn vượt quá giới hạn mã thông báo, mô hình sẽ không nhớ các trao đổi bạn đã thực hiện khi bắt đầu phiên. Phiên bản miễn phí của ChatGPT có giới hạn bộ nhớ 4.000 mã thông báo (khoảng 3.000 từ). Phiên bản trả phí, được cung cấp bởi GPT-4, mở rộng giới hạn lên 8.000 và 32.000 mã thông báo.
  • Mối quan tâm về quyền riêng tư: Khi bạn tương tác với ChatGPT, dữ liệu của bạn sẽ được gửi đến máy chủ của OpenAI. Công ty bảo tồn các phần của dữ liệu đó để đào tạo lại và cải thiện mô hình của mình. Gần đây, OpenAI gặp rắc rối với các nhà quản lý ở Ý về những lo ngại về quyền riêng tư, trong khi các công ty như Samsung đã cấm sử dụng nó vì lo ngại rằng nhân viên sẽ tiết lộ thông tin độc quyền. Điểm mấu chốt là không chia sẻ dữ liệu nhạy cảm với ChatGPT.

5. Một số lựa chọn thay thế cho ChatGPT là gì?

Một số công ty và tổ chức khác đã phát triển các LLM tuân theo hướng dẫn để so sánh với ChatGPT.

  • Google Bard: Google mới phát hành Bard , một chatbot dựa trên mô hình ngôn ngữ LaMDA. Bard có thể làm hầu hết mọi thứ bạn có thể làm với ChatGPT. Bard cũng tìm nạp dữ liệu từ Google Tìm kiếm, giúp khắc phục những hạn chế về kiến thức của LLM.
  • Trò chuyện Bing: Microsoft, công ty đã đầu tư hàng tỷ đô la vào OpenAI, đã tích hợp ChatGPT vào công cụ tìm kiếm Bing của mình (trong khi ChatGPT hiện sẽ sử dụng Bing làm nhà cung cấp dữ liệu tìm kiếm tích hợp). Trò chuyện trên Bing giúp bạn sử dụng giao diện trò chuyện để tìm kiếm kiến thức và thực hiện các tác vụ khác mà bạn sẽ làm với ChatGPT. Nó trích dẫn các nguồn thông tin mà nó tạo ra, cho phép bạn xác minh nguồn thông tin.
  • Claude: Đầu năm nay, Anthropic, một phòng thí nghiệm AI khác có trụ sở tại San Francisco, đã ra mắt Claude , một đối thủ của ChatGPT. Các khả năng của Claude rất giống với ChatGPT và công ty tuyên bố rằng họ đã nỗ lực rất nhiều để đảm bảo AI của mình phù hợp với các giá trị của con người.
  • Các mô hình nguồn mở: Cộng đồng nguồn mở đã phát hành các LLM mà bạn có thể chạy trên các máy chủ của riêng mình. Các LLM này có thể giúp bạn kiểm soát dữ liệu của mình và cũng tránh bị khóa nhà cung cấp. LLM mã nguồn mở nhỏ hơn nhiều so với ChatGPT và khó thiết lập hơn, nhưng nếu bạn có khả năng kỹ thuật, chúng có thể tạo ra kết quả ấn tượng. Một số mô hình này bao gồm Trợ lý mở , Alpaca , Vicuna , và Dolly 2 .

Để biết thêm thông tin, hãy đọc 7 lựa chọn thay thế ChatGPT sẵn sàng trả lời những câu hỏi nhức nhối của bạn.