Đây là cách bạn có thể phát hiện các video do AI tạo ra (Hiện tại)

Tác giả Security+, T.Ba 20, 2024, 01:40:32 CHIỀU

« Chủ đề trước - Chủ đề tiếp »

0 Thành viên và 1 Khách đang xem chủ đề.

Đây là cách bạn có thể phát hiện các video do AI tạo ra (Hiện tại)


Có bao nhiêu ngón tay là quá nhiều ngón tay? Với sự xuất hiện của mô hình chuyển văn bản thành video SORA của OpenAI, chúng ta đang hướng tới một tương lai không thể tránh khỏi với đầy đủ video do AI tạo ra. Tuy nhiên, công nghệ này vẫn chưa được hoàn thiện, vì vậy đây là một số mẹo để phát hiện video do AI tạo ra (hiện tại).

1. Phát hiện nội dung do AI tạo có thể là một thách thức

Thoạt nhìn, bạn sẽ được tha thứ nếu coi video do AI tạo ra là video thực sự. Chỉ khi bạn bắt đầu nhìn sâu hơn một chút, bạn mới có thể bắt đầu nhận thấy có điều gì đó không ổn.

Tất cả các ví dụ mà chúng ta sẽ nói trong bài viết này đều liên quan đến mô hình chuyển văn bản thành video SORA của OpenAI, được công bố vào tháng 2 năm 2024. Cho đến nay, đây là mô hình tiên tiến nhất thuộc loại này, chuyển đổi lời nhắc văn bản thành hình ảnh chuyển động. Mọi chuyện đã trôi qua một chặng đường dài kể từ khi bài đăng Reddit khét tiếng Will Smith ăn mì spaghetti xuất hiện vào đầu năm 2023. Tại thời điểm viết bài vào tháng 3 năm 2024, SORA vẫn đang trong quá trình thử nghiệm kín.

Việc phát hiện các bức ảnh và video do AI tạo ra mang tính nghệ thuật hơn là một môn khoa học chính xác. Có nhiều cách để biết liệu ảnh có được tạo bởi AI hay không nhưng chúng không hoạt động nhất quán. Các công cụ được thiết kế để phát hiện nội dung AI thường không đáng tin cậy, ngay cả khi nói đến văn bản.

Mục đích ở đây là nêu bật một số cách bạn có thể chọn nội dung do AI tạo ra, ít nhất là ở thời điểm hiện tại. Hãy nhớ rằng các mô hình luôn phát triển nên những đặc điểm này sẽ trở nên khó phát hiện hơn. Đôi khi việc lựa chọn chủ đề và bối cảnh của video có thể tạo nên sự khác biệt.

2. Để ý những thay đổi tinh tế và "bóng ma"

Tìm kiếm những thay đổi tinh tế là một cách để phát hiện ra AI giả mạo đầy thuyết phục, nhưng điều đó không thực sự dễ dàng. Một ví dụ về SORA của OpenAI mô tả một người phụ nữ đang đi bộ trên con phố Tokyo có ánh đèn neon. Cảnh quay này rất ấn tượng đối với một công cụ chuyển văn bản thành video, ấn tượng đến mức bạn có thể đã bỏ lỡ cảnh thay đổi trang phục ở cuối cảnh quay.

Trang phục của người phụ nữ trong cảnh mở đầu là một chiếc váy đỏ với áo len dài và áo khoác da. Chiếc áo cardigan hơi lạ ở cách nó có vẻ hòa quyện với áo khoác, nhưng tôi không hẳn là Mr Fashion nên tôi sẽ cho qua:


Bây giờ, hãy nhìn cận cảnh bộ quần áo đó và bạn sẽ thấy chiếc váy hiện có những mảng màu tối trên đó và chiếc áo khoác da có ve áo lệch tâm lớn hơn nhiều:


Điều này tinh tế đến mức hầu hết mọi người sẽ phải xem lại đoạn phim nhiều lần để phát hiện ra nó. Khung cảnh dày đặc, chứa đầy những hình ảnh phản chiếu và các diễn viên nền giúp bạn phân tâm khỏi sự hớ hênh.

Một điều khác cần chú ý là ma hoặc các vật thể xuất hiện và biến mất dần. Video của OpenAI về cơn sốt vàng ở thị trấn California là một ví dụ điển hình về điều này. Hãy nhìn vào hình ảnh có vẻ khá mơ hồ này, mà bộ não của bạn có thể hiểu là một người đàn ông cưỡi ngựa:


Hai giây sau, bóng người đó đã hoàn toàn biến mất. Nếu xem video, bạn sẽ thấy hình dáng này hòa mình vào bụi đất như thể nó là một con ma:


3. AI gặp khó khăn với ngón tay, kính và các yếu tố tinh tế hơn

Một trong những vấn đề lớn nhất đối với các mô hình do AI tạo ra là các chi và nếp nhăn. Đặc biệt, hãy quan sát kỹ bàn tay, đồ vật cầm trên tay, kính và cách mọi thứ tương tác với các đặc điểm của con người (như mũ, mũ bảo hiểm hoặc thậm chí cả tóc).

Video có thể giúp phát hiện loại lỗi này dễ dàng hơn so với chụp ảnh do AI tạo ra vì các tính năng này có thể thay đổi từ cảnh này sang cảnh khác.

Ngón tay và vị trí của bàn tay đặc biệt khó thực hiện đối với AI. Các mô hình sáng tạo có xu hướng tạo ra bàn tay có nhiều hoặc ít ngón tay hơn bạn mong đợi. Đôi khi mọi thứ trông không ổn lắm, ngón tay rất gầy hoặc có quá nhiều đốt ngón tay. Các đồ vật được cầm cũng thể hiện sự rung động tương tự, đôi khi có vẻ như con người trong khung hình đã hấp thụ bất cứ thứ gì họ đang cầm.

Hãy tìm những chiếc kính có vẻ không đối xứng hoặc hợp nhất với khuôn mặt. Trong một video, chúng thậm chí có thể xuất hiện và biến mất khỏi tầm nhìn cũng như thay đổi giữa các cảnh. Điều tương tự cũng đúng với tay và chân, hãy xem video SORA này của những người ở Lagos, Nigera :


Bạn có thể bỏ cánh tay thứ ba ra khỏi chân tôi được không?

4. Nhìn kỹ vào các đối tượng trong nền của hình ảnh

Chi tiết nền thường là yếu tố không thể thiếu khi nói đến video do AI tạo ra, thậm chí còn hơn cả ảnh. Một bức ảnh giả mạo tốt phụ thuộc vào việc đối tượng có đủ sức thuyết phục để khiến bạn phân tâm rằng hậu cảnh không hoạt động như bình thường.

Hãy xem lại video cảnh đêm ở Tokyo. Cảnh này dày đặc đến mức bạn có thể dễ dàng coi mọi thứ theo đúng bề ngoài, nhưng hãy nhìn kỹ vào những người đang đi ở hậu cảnh, đặc biệt là những người ở bên trái đối tượng:


Một số chuyển động này có vẻ không ổn. Tại một thời điểm, một người dường như tự nhân đôi chính mình. Sau đó, những gì có vẻ là một nhóm người dường như biến thành một vật thể duy nhất như thể tất cả họ đều mặc cùng một chiếc váy hoặc áo khoác ngoài. Ở một số khu vực, hình ảnh động đi bộ cũng kỳ quặc.

Hãy để ý đến hoạt động nền đáng ngờ để phát hiện video do AI tạo. Đôi khi bạn sẽ nhận thấy các vật thể tự nhiên như cây cối, cánh đồng hoặc rừng tương tác theo những cách kỳ lạ. Phối cảnh có vẻ không phù hợp, đôi khi các vật thể chuyển động không hoàn toàn thẳng hàng với đường đi được mô tả trong hoạt ảnh.

Một ví dụ khác là cảnh quay bằng máy bay không người lái trên bờ biển Big Sur của OpenAI. Bạn đã bao giờ nhìn thấy một làn sóng có vẻ thẳng như vậy chưa?

5. Ánh sáng và "Hào quang AI"

Đây là điều mà chúng ta đã thấy rất nhiều trong các bức ảnh do AI tạo ra và nó được cho là mang tính "cảm giác" hơn là một đặc điểm có thể nhận dạng một cách khách quan. Nếu ánh sáng có cảm giác đặc biệt phẳng và không tự nhiên trong trường hợp bạn mong đợi nhiều sự khác biệt hơn, điều đó có thể báo hiệu rằng nó có thể không có thật.

Ví dụ: việc thiếu các điểm không hoàn hảo của máy ảnh như hiện tượng nhòe, cháy sáng vùng sáng (trong đó điểm sáng bị mất do có quá nhiều ánh sáng đi vào ống kính) hoặc hiện tượng đổ bóng (khi chi tiết bóng bị mất do thiếu ánh sáng) đơn giản là không. hiện tại.

Mọi thứ có thể trông hơi giống một video ca nhạc được sản xuất kỹ lưỡng hoặc giống trò chơi điện tử thời kỳ trước khi có ánh sáng và dò tia thực tế. Đối tượng có thể trông được chiếu sáng hoàn hảo trong những trường hợp mà bạn không mong đợi.

6. Hiệu ứng Thung lũng kỳ lạ

Hiệu ứng thung lũng kỳ lạ là thuật ngữ dùng để mô tả sự pha trộn giữa những đặc điểm của con người và phi nhân tính theo cách khiến người xem cảm thấy khó chịu. Android hoặc robot giống con người là những ví dụ thường được trích dẫn vì chúng có vẻ ngoài giống con người nhưng đồng thời không thể tránh khỏi là vô nhân đạo.

Thông thường, hiệu ứng thung lũng kỳ lạ chỉ đơn giản xuất phát từ một cảm giác. Bạn có thể cảm nhận được điều gì đó không ổn, nhưng bạn không thể xác định chính xác nó là gì. Hiệu ứng này thường xuất hiện trong các bức ảnh và video do AI tạo ra và một lĩnh vực mà tôi đã trải nghiệm là trong video về người du hành vũ trụ của SORA.

Bỏ qua một giây rằng người phi hành gia đang đội một chiếc mũ bảo hiểm không gian dệt kim, có điều gì đó ở khuôn mặt này khiến tôi rùng mình:


Và có một bà ngoại ma quái tương tự không thổi tắt được nến sinh nhật của mình, trông còn tệ hơn nhiều khi chuyển động:


7. Hãy coi chừng những điều vô nghĩa

Đây có vẻ như là dấu hiệu cảnh báo dễ phát hiện nhất, nhưng đôi khi bộ não của bạn lại bỏ qua mọi việc. Đoạn video về người du hành vũ trụ nói trên là một ví dụ điển hình cho điều này. Có một cảnh ngắn về một cánh cửa, tay cầm, đòn bẩy hoặc thứ gì đó vô nghĩa:


Thứ này là gì vậy? Tại sao hình ảnh động dường như được phát ngược lại? Tôi có thể tha thứ cho chiếc mũ bảo hiểm dệt kim, nhưng thứ này đã khiến tôi bối rối kể từ lúc tôi nhìn thấy nó.

Các chuyển động cũng vậy. Video về chú mèo SORA trên giường rất ấn tượng nhưng chuyển động chưa đúng. Người nuôi mèo sẽ nhận ra hành vi đó là kỳ lạ và không tự nhiên. Có vẻ như có sự không phù hợp giữa hành vi của đối tượng và bối cảnh của tình huống. Theo thời gian, điều này sẽ được cải thiện.

Văn bản bị cắt xén là một ví dụ điển hình khác về những gì mà quá trình tạo ra AI thường mắc phải. Các nhân vật người Nhật trong video cảnh đêm Tokyo của SORA rất lộn xộn, và một số biển hiệu trên đường và cửa hàng cũng vậy. Chọn một cảnh mà hầu hết mọi người không thể phân biệt được tiếng Nhật với lời tri ân tồi tệ là một lựa chọn thông minh của OpenAI.

8. Rèn luyện bản thân để phát hiện nội dung này tốt hơn

Cách tốt nhất để rèn luyện bản thân phát hiện nội dung do AI tạo ra là tự nghiên cứu nội dung đó. Hầu hết các mô hình sáng tạo đều có cộng đồng tích cực cả trên web và trên các nền tảng truyền thông xã hội như Reddit. Tìm một số và xem những gì mọi người đang nghĩ ra.

Ngoài ra, bạn có thể tạo hình ảnh của riêng mình bằng công cụ như Stable Diffusion. Tại thời điểm viết bài, SORA của OpenAI chưa có sẵn cho mục đích sử dụng công cộng nên bạn sẽ phải đợi trước khi tự mình sử dụng.

Video do AI tạo ra rất ấn tượng, hấp dẫn và đáng sợ ở mức độ tương đương. Theo thời gian, những mẹo này có thể sẽ trở nên ít phù hợp hơn khi các mô hình khắc phục được điểm yếu của chúng. Vì vậy, hãy thắt dây an toàn vì bạn vẫn chưa thấy gì cả.