Tìm hiểu cách ChatGPT hoạt động đã giúp tôi sử dụng nó tốt hơn

Tác giả ChatGPT, T.Chín 19, 2024, 06:37:44 CHIỀU

« Chủ đề trước - Chủ đề tiếp »

0 Thành viên và 1 Khách đang xem chủ đề.

ChatGPT thật là hữu ích trong một vài trường hợp cụ thể.

  • ChatGPT là mô hình chuyển đổi cho các tương tác dựa trên trò chuyện.
  • GPT được đào tạo trước trên dữ liệu internet khổng lồ để tạo ra phản hồi.
  • Bạn có thể sử dụng ChatGPT để đưa ra lời nhắc giàu ngữ cảnh, phong cách viết và động não sáng tạo.


Một số người sử dụng ChatGPT như Google, trong khi những người khác mong đợi nó hoạt động như một đại diện hỗ trợ hoặc trợ lý kỹ thuật số. Tuy nhiên, ChatGPT không phải là công cụ tìm kiếm cũng không phải là con người, dẫn đến những câu trả lời đáng thất vọng. Hiểu cách công cụ AI hoạt động có thể giúp bạn có được phản hồi tốt hơn từ nó.

1. Hiểu về mô hình GPT hỗ trợ ChatGPT

Có một niềm tin rằng biết tên của ai đó (hoặc cái gì đó) có thể cho bạn quyền lực đối với họ, và tôi ngạc nhiên về mức độ đúng của nó đối với ChatGPT. Ngay khi tôi hiểu ChatGPT là gì, tôi đã có được cái nhìn sâu sắc hơn về hoạt động bên trong của công cụ, từ đó cho phép tôi sử dụng nó tốt hơn.

Để tham khảo, ChatGPT là viết tắt của Chat Generative Pre-Trained Transformer. Điều này có nghĩa là về cơ bản đây là một ứng dụng của kiến trúc GPT (Generative Pre-trained Transformer) được thiết kế riêng cho các tương tác đàm thoại (tức là dựa trên trò chuyện). Sau đây là một bản phân tích nhanh về ý nghĩa của từng từ để bạn có thể hiểu rõ hơn.

1.1. "Transformer" trong GPT là gì?

Mô hình "Transformer" là một kiến trúc mạng nơ-ron được sử dụng để xử lý ngôn ngữ tự nhiên. Đây là một công cụ mang tính cách mạng trong không gian AI, tạo thành xương sống của ChatGPT cùng với tất cả các chatbot AI phổ biến mà chúng ta có ngày nay.

Khái niệm cơ bản đằng sau các mô hình biến đổi là phân tích một loạt các đầu vào cùng một lúc (tức là song song) để xác định các yếu tố nào có liên quan nhất. Điều này hoàn toàn trái ngược với các mô hình trước đây, phân tích văn bản theo trình tự, khiến việc tìm các phần quan trọng hoặc có liên quan hơn trong một đoạn văn trở nên khó khăn hơn.

Quá trình phân tích toàn bộ văn bản này được gọi là "tự chú ý" và lần đầu tiên được một nhóm các nhà nghiên cứu AI tại Google Brain đưa ra khái niệm trong bài báo năm 2017 của họ " Sự chú ý là tất cả những gì bạn cần ".

Sử dụng "tự chú ý", các mô hình Transformer có thể xem toàn bộ chuỗi từ cùng lúc. Điều này cho phép nó hiểu ngữ cảnh và mối quan hệ giữa các từ hiệu quả hơn nhiều. Do đó, các mô hình Transformer có thể nắm bắt ngữ cảnh từ đầu vào do con người cung cấp và sau đó tạo ra đầu ra có liên quan theo ngữ cảnh thực sự có ý nghĩa.

1.2. GPT được "đào tạo trước" như thế nào?

GPT được "Đào tạo trước" trên một tập dữ liệu khổng lồ—gần như toàn bộ internet mở. Bằng cách xử lý lượng văn bản khổng lồ này, GPT học được các mẫu, mối quan hệ và cấu trúc trong ngôn ngữ. Nó cũng học về nhiều sự kiện và thông tin khác nhau, có thể đúng hoặc không đúng, nhưng chúng được lưu trữ trong tập dữ liệu của nó, mà nó có thể sử dụng khi tạo phản hồi.

Sự hiện diện của quá nhiều thông tin sai lệch (có thể thấy từ dữ liệu internet) trong tập dữ liệu đào tạo là một trong những lý do chính khiến ChatGPT có thể đưa ra thông tin không chính xác khi bạn hỏi nó một câu hỏi—một hiện tượng được gọi là ảo giác.

Để giảm thiểu vấn đề này, người chú thích và người quản lý dữ liệu sẽ vào cuộc. Công việc của họ là lọc dữ liệu đào tạo và loại bỏ nội dung chất lượng thấp hoặc không phù hợp. Ngoài ra, các kỹ thuật như Học tăng cường từ phản hồi của con người (RLHF) được sử dụng để tinh chỉnh mô hình, nâng cao độ chính xác thực tế và sự phù hợp với kỳ vọng của người dùng.

Nhờ phương pháp đào tạo có chọn lọc này, các mô hình GPT thường cung cấp thông tin chính xác cho các truy vấn cụ thể, ngay cả khi internet chứa rất nhiều thông tin sai lệch.

Mô hình học cách phân biệt thông tin đáng tin cậy dựa trên các mẫu và tính nhất quán trong dữ liệu đào tạo của nó. Nếu một thông tin xuất hiện thường xuyên và nhất quán từ các nguồn đáng tin cậy, mô hình có nhiều khả năng coi thông tin đó là đáng tin cậy.

1.3. GPT "Tạo" Nội dung như thế nào?

Bây giờ, bạn hẳn đã hiểu rõ cách ChatGPT biết những gì nó biết—tiền đào tạo của nó, và cách nó hiểu văn bản đầu vào của bạn—mô hình biến đổi. Mảnh ghép cuối cùng của câu đố là hiểu cách nó có thể tạo ra các phản hồi có liên quan theo ngữ cảnh!

Trong khi ChatGPT sử dụng self-attention để xử lý tất cả dữ liệu đầu vào cùng một lúc, nó tạo ra các phản hồi từng từ một. Mỗi từ được dự đoán dựa trên ngữ cảnh của các từ trước đó và dữ liệu đầu vào của bạn—một quá trình được gọi là tự động hồi quy.

Hãy tưởng tượng bạn đang chơi một trò chơi chữ, trong đó bạn nhìn vào các từ đã xuất hiện trước đó và đoán xem từ nào sẽ xuất hiện tiếp theo. Bạn cứ đoán từng từ tiếp theo cho đến khi bạn hoàn thành một câu và cuối cùng là toàn bộ suy nghĩ! Về cơ bản, đó là cách GPT tạo ra phản hồi—chỉ khác là nó thực hiện điều này với tốc độ siêu phàm và có một "vốn từ vựng" khổng lồ để sử dụng.

Ví dụ, giả sử bạn hỏi ChatGPT: "Thủ đô của Pháp là gì?"

Sau đó, nó sẽ tạo ra phản hồi từng từ một như thế này:

Mã nguồn [Chọn]
The
The capital
The capital of
The capital of France
The capital of France is
The capital of France is Paris.

Lý do tại sao nó có thể nói chính xác "Paris" thay vì, chẳng hạn, "New York" là do sự kết hợp giữa quá trình đào tạo trước mở rộng trên các tập dữ liệu đa dạng và rộng lớn và Học tăng cường của con người mà nó đã trải qua. Quá trình đào tạo này giúp mô hình hiểu thông tin thực tế và ưu tiên các phản hồi chính xác.

Vì vậy, như bạn có thể thấy, GPT không lấy các câu trả lời được viết sẵn từ cơ sở dữ liệu khi bạn đặt câu hỏi. Thay vào đó, nó tạo ra văn bản mới mỗi khi bạn đặt câu hỏi dựa trên dữ liệu đào tạo của nó.

2. Việc học điều này giúp tôi sử dụng ChatGPT tốt hơn như thế nào?

Hiểu được cách thức hoạt động bên trong của ChatGPT đã cải thiện đáng kể khả năng tận dụng công cụ mạnh mẽ này của tôi. Sau đây là một số hiểu biết và mẹo quan trọng bắt nguồn trực tiếp từ việc biết cách ChatGPT hoạt động:

2.1. Tôi có thể tận dụng sự hiểu biết theo ngữ cảnh của nó

Một trong những phần tốt nhất của mô hình GPT là nó rất tuyệt vời trong việc trích xuất ngữ cảnh từ thông tin đầu vào của bạn. Không giống như tìm kiếm của Google, nơi mà sự ngắn gọn là lý tưởng, với ChatGPT, bạn nên nhập các lời nhắc dài dòng. Ngay cả khi bạn kết thúc bằng việc đưa vào thông tin thừa, bạn có thể yên tâm rằng công cụ này đủ thông minh để bỏ qua các bit không cần thiết và tập trung vào các phần quan trọng để cung cấp câu trả lời toàn diện và hữu ích hơn.

Hơn nữa, bạn cũng có cơ hội đặt câu hỏi tiếp theo. Điều này có nghĩa là nếu bạn không thích một phản hồi cụ thể nào đó vì định dạng hoặc thiếu thông tin, bạn có thể trích dẫn điều đó trong lần nhập tiếp theo của mình. ChatGPT hiện sẽ xem xét toàn bộ lịch sử trò chuyện trước đó, bao gồm tất cả các dữ liệu nhập của bạn và các thế hệ trước, để tạo ra phản hồi tốt hơn, phù hợp hơn với mong đợi của bạn.

Ví dụ, thay vì hỏi:

Mã nguồn [Chọn]
Hãy cho tôi biết về năng lượng tái tạo.
Hãy thử lời nhắc:

Mã nguồn [Chọn]
Tôi quan tâm đến các nguồn năng lượng tái tạo, đặc biệt là năng lượng mặt trời và năng lượng gió. Bạn có thể cung cấp thông tin chi tiết về cách thức hoạt động của các công nghệ này, lợi ích của chúng và tác động của chúng đến môi trường không?
2.2. Tôi sử dụng Pretraining rộng lớn của nó

GPT được đào tạo trước trên một bộ sưu tập dữ liệu khổng lồ. Điều này có nghĩa là nó nhận biết được nhiều phong cách viết, giọng điệu và giọng nói khác nhau. Bạn có thể sử dụng điều này để tăng cường khả năng viết của riêng mình và mang lại cho nó phong cách và sự tinh tế. Ví dụ, tôi có thể viết một email cũ nhàm chán và sau đó yêu cầu ChatGPT làm cho nó hấp dẫn hoặc chuyên nghiệp hơn hoặc thậm chí làm cho nó đọc giống như được viết bởi Seth Godin.

Bộ đào tạo rộng lớn cũng có nghĩa là ChatGPT nhận thức được nhiều chủ đề và khái niệm khác nhau. Bạn có thể sử dụng điều này để có lợi cho mình khi khám phá chủ đề hoặc động não. Ý tôi là, sáng tạo là gì ngoài việc tìm ra mối liên hệ giữa chủ đề A và chủ đề B? Bạn có thể sử dụng ChatGPT để nhanh chóng luân chuyển qua các hoán vị và kết hợp khác nhau của các chủ đề liên quan và tình cờ tìm ra những ý tưởng mới lạ. Đây là một cách tuyệt vời để giúp não bạn hoạt động, đặc biệt là khi bạn đang bị mắc kẹt trong tình trạng suy thoái sáng tạo.

2.3. Tôi sử dụng nó cho tiểu thuyết, không phải sự thật

Mặc dù, nhờ RLHF, ChatGPT tạo ra nhiều câu trả lời chính xác hơn trước đây, nhưng nó vẫn không miễn nhiễm với ảo giác và có thể hiển thị thông tin sai lệch với tất cả sự tự tin trên thế giới. Bây giờ, thật dễ dàng để bắt gặp những ảo giác này nếu bạn thành thạo về chủ đề bạn đang khám phá với ChatGPT. Tuy nhiên, nếu bạn đang khám phá những thứ mà bạn biết ít, thì thật khó để tin tưởng ChatGPT, đặc biệt là khi bạn đã biết ChatGPT hoạt động như thế nào.

Đây là lý do tại sao tôi không bao giờ sử dụng ChatGPT để có được câu trả lời thực tế. Thay vào đó, tôi sử dụng nó để khám phá các chủ đề mà tôi đã hiểu biết và diễn đạt chúng bằng ngôn ngữ dễ hiểu hơn. Ví dụ, tôi có thể viết ra, bằng lời của riêng mình, cách giải phương trình vi phân và sau đó sử dụng ChatGPT để giúp phương pháp của tôi dễ hiểu hơn đối với một đứa trẻ 10 tuổi.

Bằng cách ghi nhớ những mẹo này và hiểu được cơ chế cơ bản của ChatGPT, bạn có thể tạo ra những lời nhắc hiệu quả hơn, tham gia vào các cuộc trò chuyện hiệu quả hơn và cuối cùng là khai thác nhiều giá trị hơn từ công cụ AI mạnh mẽ này.