ChatGPT có phải là Trình dịch tốt hơn Google Dịch không?

Tác giả Security+, T.Ba 14, 2024, 05:30:32 CHIỀU

« Chủ đề trước - Chủ đề tiếp »

0 Thành viên và 1 Khách đang xem chủ đề.

ChatGPT có phải là Trình dịch tốt hơn Google Dịch không?


ChatGPT đã vượt qua Google Dịch trong công việc của chính mình chưa?

  • ChatGPT vượt trội trong việc hiểu thành ngữ, phương ngữ và tiếng lóng tốt hơn Google Dịch, với kiến thức chuyên sâu về sắc thái ngôn ngữ.
  • Google Translate chính xác hơn và ít mắc lỗi hơn.
  • Mặc dù Google Translate hiện đang vượt trội hơn nhưng ChatGPT lại cho thấy những kết quả đầy hứa hẹn và có thể thấy những cải tiến lớn trong tương lai gần.


ChatGPT là một công cụ AI đáng gờm có thể "nói" được hầu hết mọi ngôn ngữ, vì vậy việc nó có thể dịch giữa các ngôn ngữ này là điều đương nhiên. Mặt khác, Google Dịch đã được cải tiến qua nhiều năm và cực kỳ chính xác. Điều này đặt ra câu hỏi: Liệu ChatGPT có thể đánh bại Google Translate trong trò chơi của chính nó không?

1. Điều gì khiến Google Dịch và ChatGPT khác biệt trong phương pháp dịch thuật của họ?

Google Dịch là một công cụ được xây dựng có mục đích để dịch ngôn ngữ. Đó là một loại Trình dịch máy thần kinh (NMT) và mục tiêu chính của nó là dự đoán chuỗi các từ trong câu với sự trợ giúp của mạng lưới thần kinh nhân tạo. Một trong những ưu điểm chính của dịch máy là chúng tính đến ngữ cảnh khi dịch.

Mặt khác, ChatGPT là một loại Máy biến áp được đào tạo trước (GPT). Nó xử lý các luồng dữ liệu để tìm hiểu cách ngôn ngữ của con người hoạt động tự nhiên với đầu vào tối thiểu từ người tạo ra nó. Tương tự như NMT, GPT cũng có mục tiêu dự đoán chuỗi từ dựa trên ngữ cảnh được cung cấp. Nhờ được đào tạo nên ChatGPT có sự hiểu biết rộng về ngữ pháp và nghĩa của từ. ChatGPT chưa bao giờ được xây dựng với mục đích dịch ngôn ngữ như Google Dịch; nó chỉ đơn giản là sản phẩm phụ của quá trình xử lý tập dữ liệu bằng các ngôn ngữ khác nhau.

Về lý thuyết, Google Dịch sẽ giành chiến thắng trong cuộc so sánh trực tiếp này vì nó được đào tạo cho các nhiệm vụ dịch thuật cụ thể. Vì vậy, hãy xem họ thể hiện như thế nào khi được giao thứ gì đó để làm việc.

2. ChatGPT gặp khó khăn với cấu trúc câu

Mặc dù ChatGPT hiểu ngữ pháp và cú pháp (trật tự từ) đến mức có thể sửa lỗi của chúng ta, nhưng lại thiếu sót khi dịch và sau đó điều chỉnh văn bản đã dịch để tránh các cấu trúc câu khó hiểu—ngay cả bằng tiếng Anh. Để đưa ra một ví dụ, đây là một phần tóm tắt của một cuốn sách tiếng Đức có tên Wovon Wir Träumen.

Như bạn có thể thấy, ChatGPT đã dịch câu chủ yếu theo từng từ trong khi vẫn giữ cấu trúc câu gốc từ tiếng Đức, dẫn đến bản dịch nghe có vẻ không tự nhiên. Điều này cũng đúng nếu chúng ta cố gắng dịch từ tiếng Anh sang tiếng Bosnia. Trong trường hợp này, tôi giao cho họ nhiệm vụ dịch "bàn đạp hiệu ứng guitar" từ tiếng Anh sang tiếng Bosnia. Google Dịch đã dịch hoàn hảo và điều chỉnh cụm từ này để nghe có vẻ tự nhiên, trong khi ChatGPT dịch sai thành "hiệu ứng của bàn đạp cho đàn guitar", điều này thật vô nghĩa.

Đúng là điều này không xảy ra với mọi cụm từ tôi đã thử. ChatGPT đã cố gắng dịch chính xác một số cụm từ—ở cấp độ của Google Dịch—trước khi tôi tìm thấy một ví dụ không hoạt động tốt. Cũng cần lưu ý rằng cả hai công cụ đều đã thêm "za" (có nghĩa là "cho") vào cụm từ để nó phù hợp hơn với các quy tắc ngữ pháp của ngôn ngữ; chỉ là ChatGPT không biết đặt nó ở đâu.

3. ChatGPT không tính đến ngữ cảnh

Khi tôi đưa cho ChatGPT và Google Translate một cụm từ cơ bản để dịch sang tiếng Anh, cả hai đều làm khá tốt. Trong trường hợp này, tôi đã đưa cho họ cụm từ tiếng Bosnia "držač za telefon" để dịch sang tiếng Anh và cả hai công cụ đều hoạt động rất xuất sắc.

Tuy nhiên, ChatGPT thường gặp khó khăn với ngữ cảnh vì nó thiếu hiểu biết về các sắc thái của ngôn ngữ. Điều này dẫn đến những bản dịch bị hiểu sai do lựa chọn từ ngữ không tốt. Trong ví dụ sau, ChatGPT đã thay thế động từ "pass" cho "give" để dịch "Xin vui lòng đưa chìa khóa xe cho tôi" từ tiếng Bosnia sang tiếng Anh.

Đây không phải là một chi tiết lớn nhưng nó cho thấy Google Dịch đã trở nên tốt như thế nào trong việc tiếp thu và dịch các sắc thái tinh tế. Đồng thời, tôi phải khen ngợi ChatGPT đã dịch chính xác "chìa khóa ô tô" thay vì dịch ra nghĩa đen sẽ dẫn đến "chìa khóa ô tô".

Đúng là điều này đã không xảy ra với mọi cụm từ tôi đã chạy qua hai công cụ. ChatGPT đã cố gắng dịch chính xác một số cụm từ—giống như Google Dịch—trước khi tôi tìm thấy một ví dụ không hoạt động tốt.

4. ChatGPT đánh bại Google Dịch trong việc tìm ra thành ngữ, phương ngữ và tiếng lóng

Có thể cho rằng, tính năng hữu ích nhất của ChatGPT trong bối cảnh dịch ngôn ngữ là nó có thể nhận dạng thành ngữ. Thành ngữ là những cách diễn đạt phổ biến có nghĩa bóng—chúng có nghĩa khác với những gì được nói theo nghĩa đen. Ví dụ, khi bạn nói "cái ống hút cuối cùng", bạn không thực sự đang nói về cái ống hút; bạn đang đề cập đến thực tế là sự kiên nhẫn của bạn đã cạn kiệt. Đây là một ví dụ sử dụng thành ngữ phổ biến của Đức "Den Bock zum Gärtner machen."

Như bạn có thể thấy, cả ChatGPT và Google Translate đều dịch thành ngữ dê làm vườn này theo nghĩa đen. Tuy nhiên, ChatGPT đã tiến một bước xa hơn khi giải thích rằng đó là một thành ngữ và thậm chí còn đưa ra lời giải thích xuất sắc. Đáng ngạc nhiên là Google Dịch thậm chí còn không thừa nhận rằng đó là một thành ngữ—ai đó dịch cụm từ này từ tiếng Đức sẽ hoàn toàn bối rối. Và vì ChatGPT không chỉ là một dịch giả đơn thuần nên tôi đã tiến một bước xa hơn bằng cách yêu cầu nó cung cấp một thành ngữ tương đương trong tiếng Anh:


Đây là một tính năng tiện dụng mà chúng tôi mong đợi sẽ thấy từ Mô hình ngôn ngữ lớn (LLM) như ChatGPT. Nó có thể tổ chức những cuộc trò chuyện có phần thuyết phục và mặc dù nó không phải là dịch giả giỏi nhất thế giới nhưng nó chắc chắn là dịch thuật linh hoạt nhất.

Phương ngữ là một lĩnh vực khác mà ChatGPT vượt trội, trong khi Google Dịch có xu hướng kém hơn. Điều này có thể được mở rộng cho tất cả các biến thể ngôn ngữ không chuẩn và các ngôn ngữ chuyên biệt như pidgins và creoles. Để cho bạn một ví dụ, tôi đã dùng cụm từ "Trong khi điều gì đó xảy ra?" từ tiếng Pidgin của Nigeria, có nghĩa là "Chuyện gì đang xảy ra vậy?" mà không chỉ rõ đó là ngôn ngữ gì. Dưới đây là kết quả:

Mặc dù Google Dịch không thể nhận ra ngôn ngữ pidgin vì nó không được hỗ trợ chính thức nhưng ChatGPT không gặp vấn đề gì khi dịch cụm từ này cho chúng tôi. Điều này cũng đúng với tiếng lóng thích hợp. Mặc dù Google Dịch biết nhiều từ lóng nhưng ChatGPT vẫn vượt trội hơn nó rất nhiều, có lẽ vì nó có cơ sở dữ liệu lớn hơn. Trong ví dụ sau, ChatGPT hiểu và dịch chính xác một thuật ngữ thông tục phổ biến trong tiếng Đức có nghĩa là "đi ngủ", trong khi Google Dịch cho rằng "Heia" là một danh từ riêng và vẫn giữ nguyên dạng ban đầu.

5. Google Dịch thắng... Hiện tại

Bây giờ chúng ta đã thấy một số ví dụ về khả năng hiểu từ ngữ tuyệt vời của ChatGPT. Nếu bạn yêu cầu ChatGPT giải thích nghĩa của một từ, rất có thể nó sẽ cho bạn câu trả lời đúng. Google Dịch chỉ giới hạn ở việc dịch từ ngôn ngữ này sang ngôn ngữ khác; bạn không thể yêu cầu nó giải thích từ đó, sử dụng nó trong một câu hoặc cung cấp ngữ cảnh.

Tuy nhiên, nhìn chung, Google Dịch chính xác hơn và mắc ít lỗi hơn trong các thử nghiệm của tôi. Tôi đã kiểm tra kỹ lưỡng cả hai công cụ và chỉ trình bày một số ví dụ hay nhất và tôi có thể tự tin nói rằng bạn nên luôn thử Google Dịch trước khi dịch. Chỉ chuyển sang ChatGPT nếu Google Dịch cung cấp cho bạn nội dung nào đó có vẻ không ổn. Thậm chí tốt hơn, bạn có thể chạy một đoạn văn bản thông qua Google Dịch và sau đó hỏi ChatGPT xem mọi thứ có ổn không.

Điều đáng chú ý ở đây là các công cụ AI tổng quát tiên tiến như ChatGPT cực kỳ linh hoạt và khả năng dịch thuật của chúng sẽ ngày càng được cải thiện. Bạn đã có thể sử dụng ChatGPT ngay hôm nay để dịch hầu hết mọi thứ với độ chính xác cao. Tất nhiên, Google có thể bổ sung các khả năng tương tự cho Google Dịch và với bộ dữ liệu lớn được quản lý, Google Dịch có thể giữ vương miện là công cụ dịch chính xác và linh hoạt nhất. Hoặc có thể nó sẽ được tích hợp hoàn toàn vào Gemini và chúng ta sẽ có được những điều tốt nhất của cả hai thế giới.