Làm thế nào để biết nếu một bài báo được viết bởi ChatGPT

sysadmin · T.Năm 12, 2023, 10:43:37 SÁNG

Làm thế nào để biết nếu một bài báo được viết bởi ChatGPT

Bạn có thể nhận biết một bài báo do ChatGPT viết bằng cấu trúc đơn giản, lặp đi lặp lại và xu hướng mắc lỗi logic và thực tế của nó. Một số công cụ có sẵn để tự động phát hiện văn bản do AI tạo, nhưng chúng dễ bị báo lỗi.

Công nghệ AI đang thay đổi những gì chúng ta nhìn thấy trực tuyến và cách chúng ta tương tác với thế giới. Từ một bức ảnh chụp Giáo hoàng trong chiếc áo khoác phao giữa hành trình đến các mô hình học ngôn ngữ như ChatGPT, trí tuệ nhân tạo đang dần đi vào cuộc sống của chúng ta.

Việc sử dụng công nghệ AI ngày càng nguy hiểm hơn, chẳng hạn như một chiến dịch đưa thông tin sai lệch về chính trị nhằm tung ra các bài báo giả mạo, có nghĩa là chúng ta cần phải tự giáo dục bản thân đủ để phát hiện ra những điều giả mạo. Vậy làm cách nào bạn có thể biết liệu một bài báo có thực sự là văn bản do AI tạo ra hay không?

1. Làm thế nào để biết nếu ChatGPT đã viết bài báo đó

Hiện có nhiều phương pháp và công cụ giúp xác định xem bài báo bạn đang đọc có phải do rô-bốt viết hay không. Không phải tất cả chúng đều đáng tin cậy 100% và chúng có thể mang lại kết quả dương tính giả, nhưng chúng cung cấp một điểm khởi đầu.

Một điểm đánh dấu lớn của văn bản do con người viết, ít nhất là cho đến bây giờ, là tính ngẫu nhiên. Mặc dù mọi người sẽ viết bằng các phong cách và tiếng lóng khác nhau và thường mắc lỗi chính tả, nhưng các mô hình ngôn ngữ AI rất hiếm khi mắc những lỗi đó. Theo MIT Technology Review, "văn bản do con người viết có nhiều lỗi chính tả và rất hay thay đổi", trong khi các mô hình văn bản do AI tạo ra như ChatGPT tốt hơn nhiều trong việc tạo văn bản không có lỗi chính tả. Tất nhiên, một trình chỉnh sửa bản sao tốt sẽ có tác dụng tương tự, vì vậy bạn phải quan sát nhiều thứ hơn là chỉ sửa lỗi chính tả.

Một chỉ báo khác là các mẫu dấu chấm câu. Con người sẽ sử dụng dấu câu ngẫu nhiên hơn so với mô hình AI. Văn bản do AI tạo ra cũng thường chứa nhiều từ kết nối hơn như "the", "it" hoặc "is" thay vì các từ lớn hơn ít được sử dụng hơn vì các mô hình ngôn ngữ lớn hoạt động bằng cách dự đoán từ nào sẽ có khả năng xuất hiện tiếp theo nhất, chứ không phải từ một cái gì đó sẽ âm thanh tốt theo cách mà một con người có thể.

Điều này có thể thấy được trong câu trả lời của ChatGPT đối với một trong những câu hỏi có sẵn trên trang web của OpenAI. Khi được hỏi, "Bạn có thể giải thích điện toán lượng tử bằng các thuật ngữ đơn giản không," bạn sẽ nhận được những câu như: "Điều khiến các qubit trở nên đặc biệt là chúng có thể tồn tại ở nhiều trạng thái cùng một lúc, nhờ một thuộc tính gọi là chồng chất. Nó giống như một qubit có thể đồng thời là 0 và 1. "

Các từ kết nối ngắn, đơn giản thường được sử dụng, các câu đều có độ dài tương tự nhau và các đoạn văn đều có cấu trúc tương tự nhau. Kết quả cuối cùng là cách viết nghe có vẻ hơi máy móc.

2. Bạn có thể sử dụng AI để phát hiện văn bản do AI tạo không?

Bản thân các mô hình ngôn ngữ lớn có thể được đào tạo để phát hiện chữ viết do AI tạo ra. Đào tạo hệ thống trên hai bộ văn bản — một do AI viết và một do con người viết — về mặt lý thuyết có thể dạy mô hình nhận dạng và phát hiện chữ viết của AI như ChatGPT.

Các nhà nghiên cứu cũng đang nghiên cứu các phương pháp đánh dấu chìm để phát hiện các bài báo và văn bản AI. Tom Goldstein, giảng viên khoa học máy tính tại Đại học Maryland, đang nghiên cứu cách xây dựng hình mờ thành các mô hình ngôn ngữ AI với hy vọng rằng nó có thể giúp phát hiện chữ viết do máy tạo ra ngay cả khi nó đủ tốt để bắt chước tính ngẫu nhiên của con người.

Không thể nhìn thấy bằng mắt thường, hình mờ sẽ có thể được phát hiện bằng một thuật toán, thuật toán này sẽ chỉ ra nó là do con người hoặc AI tạo ra tùy thuộc vào tần suất nó tuân thủ hoặc vi phạm các quy tắc về hình mờ. Thật không may, phương pháp này đã không được thử nghiệm tốt trên các mẫu ChatGPT sau này.

3. Công cụ để kiểm tra xem một bài báo có được viết bởi ChatGPT hay không

Bạn có thể tìm thấy nhiều công cụ sao chép và dán trực tuyến để giúp bạn kiểm tra xem một bài viết có phải do AI tạo ra hay không. Nhiều người trong số họ sử dụng các mô hình ngôn ngữ để quét văn bản, bao gồm cả ChatGPT-4.

Ví dụ: Undetectable AI, tiếp thị chính nó như một công cụ giúp cho bài viết AI của bạn không thể phân biệt được với bài viết của con người. Sao chép và dán văn bản vào cửa sổ của nó và chương trình sẽ kiểm tra văn bản đó dựa trên kết quả từ các công cụ phát hiện AI khác như GPTZero để gán cho nó một điểm khả dĩ — về cơ bản, chương trình kiểm tra xem tám trình phát hiện AI khác có cho rằng văn bản của bạn được viết bởi rô-bốt hay không.

Tính độc đáo là một công cụ khác, hướng đến các nhà xuất bản và nhà sản xuất nội dung lớn. Nó tuyên bố là chính xác hơn các loại khác trên thị trường và sử dụng ChatGPT-4 để giúp phát hiện văn bản do AI viết. Các công cụ kiểm tra phổ biến khác bao gồm:

Hầu hết các công cụ này cung cấp cho bạn giá trị phần trăm, chẳng hạn như 96% do con người và 4% do trí tuệ nhân tạo, để xác định khả năng văn bản do con người viết. Nếu điểm là 40-50% AI hoặc cao hơn, thì có khả năng tác phẩm đó do AI tạo ra.

Mặc dù các nhà phát triển đang làm việc để cải thiện các công cụ này trong việc phát hiện văn bản do AI tạo ra, nhưng không có công cụ nào hoàn toàn chính xác và có thể đánh dấu sai nội dung của con người do AI tạo ra. Cũng có lo ngại rằng vì các mô hình ngôn ngữ lớn như GPT-4 đang cải thiện rất nhanh nên các mô hình phát hiện liên tục bắt kịp.

4. Rèn luyện trí não của bạn để nắm bắt AI

Ngoài việc sử dụng các công cụ, bạn có thể rèn luyện bản thân để nắm bắt nội dung do AI tạo ra. Nó cần thực hành, nhưng theo thời gian bạn có thể trở nên giỏi hơn.

Daphne Ippolito, một nhà khoa học nghiên cứu cấp cao tại bộ phận AI của Google, Google Brain, đã tạo ra một trò chơi có tên là Văn bản thật hay giả (ROFT) có thể giúp bạn tách các câu của con người khỏi các câu của robot bằng cách dần dần huấn luyện bạn nhận biết khi một câu có vẻ không đúng lắm..

Theo Ippolito, một điểm đánh dấu phổ biến của văn bản AI là những câu vô nghĩa như "phải mất hai giờ để pha một tách cà phê". Trò chơi của Ippolito chủ yếu tập trung vào việc giúp mọi người phát hiện những loại lỗi đó. Trên thực tế, đã có nhiều trường hợp chương trình viết bằng trí tuệ nhân tạo tuyên bố các dữ kiện không chính xác một cách hoàn toàn tự tin — có lẽ bạn cũng không nên yêu cầu chương trình này làm bài tập toán của mình vì chương trình này dường như không xử lý tốt các phép tính số.

Ngay bây giờ, đây là những phương pháp phát hiện tốt nhất mà chúng tôi có để bắt văn bản được viết bởi một chương trình AI. Tuy nhiên, các mô hình ngôn ngữ đang trở nên tốt hơn với tốc độ khiến các phương pháp phát hiện hiện tại trở nên lỗi thời khá nhanh, khiến chúng ta phải chạy đua vũ trang, như Melissa Heikkilä viết cho MIT Technology Review.

VietNetwork.Vn

Tìm kiếm