Cách bảo vệ hình ảnh của bạn khỏi trình tạo nghệ thuật AI

Tác giả sysadmin, T.Ba 22, 2023, 01:28:14 CHIỀU

« Chủ đề trước - Chủ đề tiếp »

0 Thành viên và 1 Khách đang xem chủ đề.

Cách bảo vệ hình ảnh của bạn khỏi trình tạo nghệ thuật AI


Bạn có thể thử một số cách để bảo vệ tác phẩm nghệ thuật của mình khỏi các trình tạo AI:

Từ chối tập dữ liệu đào tạo bằng một công cụ như   Đăng nhập để xem liên kết.
Sử dụng tệp "robots.txt" để tránh trình thu thập dữ liệu web, nhiều tệp trong số đó được sử dụng để tạo bộ dữ liệu ngay từ đầu.
Giữ bản quyền cho tác phẩm nghệ thuật của bạn và thách thức các nhà phát triển các công cụ này trước tòa (hoặc tham gia các vụ kiện tập thể hiện có).
Chỉ tải lên những hình ảnh có thủy ấn mạnh.
Tránh đưa nghệ thuật của bạn lên internet ngay từ đầu.


Các trình tạo nghệ thuật AI có thể không bắt kịp khả năng sáng tạo của con người, nhưng chúng chắc chắn có thể đánh lừa bạn. Đây là một mối lo lắng cho cả nghệ sĩ và những người sợ hãi việc tiếp quản AI, nhưng tất cả có thể không mất đi.

1. Cách bảo vệ tác phẩm nghệ thuật có bản quyền khỏi AI

Những người tạo nghệ thuật AI  chẳng là gì nếu không có bộ dữ liệu mà họ đã được đào tạo. Điều này liên quan đến việc lấy một lượng lớn tác phẩm nghệ thuật hiện có và bối cảnh hóa nó theo cách cho phép con người sử dụng lời nhắc ngôn ngữ tự nhiên để tạo ra tác phẩm nghệ thuật tương tự. Bạn có thể tự mình dùng thử bằng ứng dụng nghệ thuật tổng quát như OpenAI's DALL-E 2  hoặc Midjourney.

Chúng tôi đã yêu cầu DALL-E 2 tạo ra "một bức ảnh về Elmo từ Sesame Street theo phong cách của Pablo Picasso" và đây là những gì chúng tôi nhận được (vâng, đây là bức ảnh đẹp nhất trong số đó):


Có thể tạo ra tác phẩm nghệ thuật theo phong cách của những nghệ sĩ đã chết có thể không gióng lên quá nhiều hồi chuông cảnh báo, đặc biệt là trong một phong cách rất dễ nhận biết. Nhưng đối với các nghệ sĩ hiện đại, những người chia sẻ sáng tạo của họ thông qua ArtStation, DeviantArt, Behance, trang web cá nhân và các trang truyền thông xã hội như Instagram hoặc Facebook, thì điều đó còn đáng quan tâm hơn nhiều.

Vậy bạn có thể làm gì để bảo vệ những sáng tạo của chính mình khỏi bị sử dụng để huấn luyện một AI có thể tạo ra những sáng tạo nhanh hơn nhiều so với khả năng của bạn?

1.1. Chọn không tham gia tập dữ liệu đào tạo

Bạn có thể chọn không tham gia hai trong số các bộ dữ liệu đào tạo hình ảnh mở lớn nhất trên internet, LAION-400M và LAION-5B bằng cách sử dụng   Đăng nhập để xem liên kết. Các bộ dữ liệu này được sử dụng bởi một số trình tạo hình ảnh lớn nhất trên web bao gồm Khuếch tán ổn định và Google Imagen. Vì chúng thực sự mở nên nhiều công cụ AI tổng quát khác cũng sử dụng chúng.

Thật không may, quá trình làm điều này là chậm và tẻ nhạt. Trước tiên, bạn cần phải đăng ký một tài khoản, sau đó tìm kiếm hoặc tải lên một hình ảnh để tìm kết quả phù hợp trong tập dữ liệu. Sau đó, bạn có thể nhấp chuột phải vào hình ảnh trong trình duyệt web trên máy tính để bàn của mình và chọn tùy chọn "Thêm vào lựa chọn không tham gia của tôi". Ngoài ra, bạn có thể cấp quyền rõ ràng cho tập dữ liệu để sử dụng hình ảnh bằng cách nhấp vào "Thêm vào lựa chọn tham gia của tôi".


Bạn sẽ cần phải làm điều này cho mỗi hình ảnh bạn tìm thấy, vì vậy đây có thể là một quá trình khó khăn nếu bạn là một nghệ sĩ có khối lượng tác phẩm lớn. Trên thực tế, cuối cùng sẽ mất bao lâu tùy thuộc vào mức độ dễ dàng của việc lọc ra tác phẩm của bạn, điều này có thể dễ dàng hơn nếu tác phẩm của bạn được liên kết với một tên hoặc dự án duy nhất, lượng người theo dõi trực tuyến lớn, v.v.

Mặc dù hai bộ dữ liệu khổng lồ này là một nơi tuyệt vời để bắt đầu, nhưng chúng không phải là những bộ dữ liệu duy nhất được sử dụng. Các cá nhân có thể tạo bộ dữ liệu của riêng họ và một số làm để sao chép một nghệ sĩ hoặc phong cách nghệ thuật cụ thể. Một số công ty như OpenAI hoàn toàn không tiết lộ bộ dữ liệu nào mà công cụ của họ sử dụng, vì vậy không có cách nào để chống lại những điều này.

1.2. Sử dụng Robots.txt để ngăn chặn trình thu thập thông tin

Tệp robots.txt là một tài liệu văn bản nhỏ được đặt trong thư mục gốc của trang web để cho trình thu thập dữ liệu web biết nơi chúng được phép hoặc không được phép truy cập. Mặc dù Google tuyên bố rõ ràng rằng "đây không phải là một cơ chế để giữ một trang web khỏi Google", bạn vẫn có thể muốn thử và sử dụng nó để ngăn các trình thu thập dữ liệu web tiếp cận tác phẩm nghệ thuật của bạn nếu bạn đang lưu trữ nó trên trang web của riêng mình.

Như tên có thể gợi ý, trình thu thập dữ liệu web thu thập dữ liệu web để tìm kiếm nội dung để lập chỉ mục. Các công cụ tìm kiếm không phải là trình thu thập thông tin duy nhất và trình thu thập thông tin cũng được sử dụng để tạo bộ dữ liệu giống như bộ dữ liệu LAION-400M và LAION-5B đã đề cập ở trên. Vấn đề chính với robots.txt là nó dựa vào trình thu thập dữ liệu web tôn trọng yêu cầu của bạn.

Một trong những bộ dữ liệu lớn nhất hiện nay là Common Crawl, dữ liệu từ đó đã được sử dụng để xây dựng bộ dữ liệu của LAION. Quá trình thu thập dữ liệu trang web đang diễn ra, LAION cho biết bộ dữ liệu LAION-400M hiện tại (tại thời điểm viết bài) đã được tạo "từ các trang web ngẫu nhiên được thu thập dữ liệu từ năm 2014 đến năm 2021."

Thu thập thông tin chung tuyên bố rằng nó tôn trọng robots.txt và Giao thức loại trừ rô-bốt cả về mặt chặn nội dung và trì hoãn thu thập thông tin (để tiết kiệm băng thông). Bạn có thể thực hiện việc này bằng cách tạo quy tắc cho tác nhân người dùng "CCBot" trong tệp Robots.txt của mình. Tất nhiên, điều này sẽ không giúp ích gì nếu bạn không tự lưu trữ tác phẩm nghệ thuật của mình.

Trung tâm Google Tìm kiếm có một hướng dẫn hữu ích để tạo tệp robots.txt hoặc bạn có thể sử dụng một trang web như Trình tạo Robots.txt của Ryte  để tạo một tệp cho bạn. Bạn có thể cho phép hoặc vô hiệu hóa các tác nhân người dùng cụ thể từ các thư mục cụ thể hoặc chỉ cần chặn mọi thứ bằng ký tự đại diện (*). Ví dụ: tệp robots.txt chặn tất cả các tệp trong thư mục /images/ của bạn khỏi Thu thập thông tin chung trong khi vẫn cho phép các trình thu thập thông tin khác lập chỉ mục trang web của bạn sẽ đọc:

Mã nguồn [Chọn]
User-agent: CCbot
Disallow: /images/

User-agent: *
Allow: /

Sơ đồ trang web:   Đăng nhập để xem liên kết

Điều này sẽ không đánh bại các trình thu thập dữ liệu đã truy cập trang web của bạn, nhưng nó sẽ ngăn Thu thập thông tin chung lập chỉ mục thư mục /images/ của bạn (và bất kỳ tệp tải lên mới nào kể từ lần thu thập dữ liệu cuối cùng) trong tương lai.

1.3. Bản quyền tác phẩm nghệ thuật của bạn

Mặc dù bản quyền được ngụ ý trong tác phẩm mà bạn đã tạo, nhưng việc cố gắng giữ bản quyền cho tác phẩm của bạn cũng có thể đáng để nỗ lực. Tại Hoa Kỳ, bạn có thể thực hiện việc này bằng cách đăng ký tác phẩm của mình tại   Đăng nhập để xem liên kết. Bạn có thể gửi tối đa 10 tác phẩm chưa xuất bản trong một đơn đăng ký, chỉ cần lưu ý rằng có thể mất một khoảng thời gian (hiện tại là khoảng một năm) để các tác phẩm của bạn được xử lý.

Việc đăng ký bản quyền cho tác phẩm của bạn giúp bạn có thêm chỗ dựa trong các vấn đề liên quan đến tòa án. Đó là ý tưởng đằng sau một vụ kiện tập thể chống lại Stability AI (nhà phát triển Stable Diffusion và DreamStudio, nhà tài trợ của LAION), DeviantArt (nền tảng dành cho nghệ sĩ và nhà phát triển DreamUp) và Midjourney, một ứng dụng nghệ thuật tổng hợp thay mặt cho các nghệ sĩ bị ảnh hưởng.


Bạn có thể đọc tất cả thông tin về vụ kiện tại    Đăng nhập để xem liên kết và nếu bạn tin rằng công việc của mình đã được sử dụng để huấn luyện những người tạo này thì bạn có thể có cơ sở để tham gia vụ kiện tập thể bằng cách liên hệ với nhóm pháp lý. Đăng ký để tác phẩm nghệ thuật của bạn được đăng ký với Văn phòng Bản quyền Hoa Kỳ là bước đầu tiên quan trọng nếu bạn muốn đi theo con đường này.

Giống như các hoạt động khác đã thu hút luật sư trong quá khứ—vi phạm bản quyền, bẻ khóa, chia sẻ tệp—không chắc rằng một vụ kiện sẽ chấm dứt hoạt động này hoàn toàn. Người bào chữa có thể sẽ lập luận rằng những công cụ này đã được đào tạo dựa trên tài liệu "sử dụng hợp lý" được thu thập từ các trang web công khai. Chúng ta sẽ phải chờ xem để biết những vụ kiện như thế này nếu có sẽ có tác động như thế nào.

1.4. Aggressive Watermarking

Nếu bạn chỉ từng tải lên tác phẩm nghệ thuật của mình với một số hình mờ tự hủy mạnh mẽ hoặc có giới hạn, thì tác phẩm nghệ thuật có trong bộ dữ liệu sẽ phản ánh điều này. Cuối cùng, điều này phần lớn phụ thuộc vào lý do tại sao tác phẩm nghệ thuật của bạn được tải lên ngay từ đầu. Nếu bạn đang tạo tác phẩm nghệ thuật phi thương mại để giải trí trên internet, điều này cuối cùng có vẻ như tự chuốc lấy thất bại.

Tuy nhiên, nếu bạn đang bán những bức tranh trong thế giới thực và muốn có một phương tiện để trưng bày chúng trực tuyến trước khi bán, điều đó có thể giúp ích phần nào. Nó chắc chắn sẽ làm mất đi tác phẩm nghệ thuật đã hoàn thành, vì vậy đó là điều bạn sẽ phải tự mình cân nhắc.

1.5. Không tải lên nghệ thuật của bạn trên Internet

Điều này nghe có vẻ nực cười (và đúng là như vậy) nhưng nếu tác phẩm nghệ thuật của bạn không bao giờ được tải lên internet ngay từ đầu, thì sẽ không có khả năng nó bị đưa vào mạng và được sử dụng để huấn luyện AI. Tất nhiên, kiếm sống với tư cách là một nghệ sĩ mà không sử dụng internet để chia sẻ tác phẩm nghệ thuật của bạn có thể là điều gần như không thể (đặc biệt nếu bạn làm việc trong môi trường kỹ thuật số).

Đối với những nghệ sĩ làm về âm nhạc, đây là điều không thể. Ngay cả khi bạn làm việc với các chất liệu truyền thống như sơn dầu hoặc màu nước thì cũng không biết liệu có ai đó sẽ chụp một bức ảnh của tác phẩm đã hoàn thành và tự tải nó lên hay không.

2. Nghệ thuật AI có thể có bản quyền không?

Câu hỏi liệu đầu ra của AI tổng quát có thể được đăng ký bản quyền hay không là một câu hỏi phức tạp. Một điều thường được chấp nhận là công cụ AI được sử dụng để tạo ra tác phẩm nghệ thuật hiếm khi có bất kỳ quyền nào đối với đầu ra.

  • Điều này được nêu rõ trong điều khoản dịch vụ của hầu hết các công cụ, bao gồm cả Khuếch tán ổn định: Trừ khi được quy định ở đây, Bên cấp phép không yêu cầu quyền đối với Đầu ra mà Bạn tạo bằng Mô hình. Bạn chịu trách nhiệm về Đầu ra mà bạn tạo ra và những lần sử dụng tiếp theo của nó. Việc sử dụng đầu ra không được trái với bất kỳ điều khoản nào như đã nêu trong Giấy phép.
  • Giấy phép tiếp tục cấm mọi hoạt động sử dụng "vi phạm bất kỳ luật hoặc quy định hiện hành nào của quốc gia, liên bang, tiểu bang, địa phương hoặc quốc tế" bao gồm luật bản quyền.
  • Giữa hành trình: Bạn sở hữu tất cả Tài sản Bạn tạo bằng Dịch vụ, trong phạm vi có thể theo luật hiện hành. Điều này không bao gồm việc nâng cấp hình ảnh của những người khác mà hình ảnh vẫn thuộc sở hữu của người tạo Nội dung ban đầu.
  • Và OpenAI (DALL-E 2): Giữa các bên và trong phạm vi được luật hiện hành cho phép, bạn sở hữu tất cả Dữ liệu đầu vào và tùy thuộc vào việc bạn tuân thủ các Điều khoản này, OpenAI theo đây chuyển nhượng cho bạn tất cả các quyền, tư cách và lợi ích của mình đối với và đối với Đầu ra.
  • Về bản quyền đối với bất kỳ thứ gì bạn đã tạo bằng công cụ như vậy, Văn phòng Bản quyền Hoa Kỳ đã tuyên bố rằng bản quyền chỉ áp dụng cho tác phẩm nghệ thuật do con người tạo ra (cùng với các yêu cầu khác, như tính nguyên bản): Trong trường hợp quyền tác giả không phải là con người được tuyên bố, các tòa phúc thẩm đã phát hiện ra rằng bản quyền không bảo vệ các sáng tạo bị cáo buộc.

Luật không ngừng phát triển, vì vậy điều này có thể bị thách thức thành công trong tương lai. Cũng cần lưu ý rằng các yếu tố của sản phẩm cuối cùng không phải là sản phẩm của trình tạo AI (như cốt truyện hoặc hội thoại) vẫn có thể được đăng ký bản quyền ngay cả khi các yếu tố khác (như tác phẩm nghệ thuật hoặc âm nhạc) thì không.

3. Trình tạo tác phẩm nghệ thuật AI có thể sử dụng tác phẩm nghệ thuật có bản quyền của tôi không?

Câu hỏi không nhất thiết là các trình tạo AI "có thể" sử dụng tác phẩm nghệ thuật có bản quyền của bạn hay không, mà là "họ" đã sử dụng tác phẩm nghệ thuật có bản quyền của bạn chưa. Câu trả lời cho câu hỏi đó, như nhiều nghệ sĩ đã tìm ra, là có. Ở trên, chúng ta đã thảo luận về một số phương pháp chọn không tham gia bộ dữ liệu và ngăn trình thu thập thông tin lập chỉ mục nội dung của bạn, nhưng những kỹ thuật này cuối cùng phụ thuộc vào người lãnh đạo có tôn trọng sở thích của bạn hay không.

Bạn có thể tìm hiểu xem tác phẩm nghệ thuật của mình có được đưa vào bộ dữ liệu hình ảnh công khai lớn nhất hay không bằng cách sử dụng   Đăng nhập để xem liên kết. Tải lên một trong những tác phẩm nghệ thuật nổi tiếng của bạn hoặc tìm kiếm tên, tiêu đề tác phẩm nghệ thuật, webcomic hoặc tác phẩm khác của bạn và xem qua. Nếu bạn thấy tác phẩm nghệ thuật của mình xuất hiện trên trang web, thì tác phẩm nghệ thuật của bạn được đưa vào bộ dữ liệu được Stable Diffusion và những người khác sử dụng.

Đó là chưa nói đến các ứng dụng nghệ thuật tổng quát khác không tiết lộ bộ dữ liệu nào đang được sử dụng (như DALL-E của OpenAI). Bạn luôn có thể thử lời nhắc như "tác phẩm nghệ thuật theo phong cách Tên của bạn" để xem có gì quen thuộc xuất hiện không.

4. Các công cụ sắp ra mắt có thể giúp đánh bại các trình tạo nghệ thuật AI

Có thể có một số hy vọng cho các nghệ sĩ đến từ dạng công cụ có thể khiến AI tổng quát khó tái tạo tác phẩm nghệ thuật dựa trên hình ảnh trong tập dữ liệu hơn. Thật không may, những giải pháp này vẫn chưa có ở đây (tại thời điểm viết bài) và không biết chúng sẽ hiệu quả như thế nào về lâu dài. Các công cụ AI phát triển nhanh chóng, vì vậy có thể chúng sẽ phát triển để vượt qua các biện pháp bảo vệ như vậy.

Đầu tiên là Glaze, một dự án của Đại học Chicago "thêm những thay đổi rất nhỏ" vào tác phẩm nghệ thuật trước khi được tải lên. Các nhà phát triển gọi những thay đổi này là "áo choàng phong cách" và lưu ý rằng tác phẩm nghệ thuật xuất hiện — đối với mắt người — gần giống với bản gốc trong khi khiến AI hiểu sai phong cách này thành phong cách của người khác.


Glaze sẽ được phát hành dưới dạng ứng dụng dành cho Mac và Windows, vì vậy tác phẩm nghệ thuật có thể được "che đậy" mà không cần rời khỏi máy tính của nghệ sĩ. Các nhà phát triển cho biết họ sẽ không thương mại hóa công cụ này, vì vậy nó sẽ miễn phí sử dụng cho bất kỳ ai. Dự án Glaze coi công cụ này là "bước đầu tiên cần thiết hướng tới các công cụ bảo vệ lấy nghệ sĩ làm trung tâm để chống lại sự bắt chước của AI".

Một kỹ thuật khác được nêu trong blog Pursuit của Đại học Melbourne mô tả việc sử dụng nhiễu một cách tinh tế để "chỉ thay đổi một lượng pixel vừa đủ trong một hình ảnh để gây nhầm lẫn cho AI và biến nó thành một hình ảnh 'không thể học được'." Tổ chức tuyên bố đã đưa ra một kỹ thuật khai thác điểm yếu trong các mô hình và đi xa hơn là mô tả các công cụ như Khuếch tán ổn định là "những người học lười biếng".

Kỹ thuật này có nhiều ứng dụng tiềm năng bao gồm tác phẩm nghệ thuật trực quan cũng như âm thanh và hình ảnh nhận dạng cá nhân bạn. Điều quan trọng là phải nhận ra rằng những kỹ thuật này vẫn còn ở giai đoạn đầu phát triển, vì vậy chúng ta sẽ phải chờ xem chúng thực sự có khả năng gì.

5. Sự trỗi dậy của Robot

Các ứng dụng nghệ thuật sáng tạo có thể tạo tác phẩm nghệ thuật ngay lập tức, nhưng chúng không thực sự sáng tạo giống như con người. ChatGPT có thể viết sơ yếu lý lịch của bạn, nhưng bạn cần đọc lại nó cẩn thận vì chatbot thường sai một cách chắc chắn.

Điểm mấu chốt là các giải pháp AI hiện tại có thể hữu ích nhưng chúng cũng yếu.