Twoje dane są nową walutą. Każdy post, który publikujesz w internecie, może zostać wykorzystany do szkolenia systemów sztucznej inteligencji (AI), takich jak ChatGPT, Midjourney czy Sora. W artykule przyjrzymy się, jak i dlaczego nasze cyfrowe życie staje się paliwem dla AI.

Generatywna AI, aby odnieść sukces musi być trenowana na ogromnej ilości danych pochodzących z różnych źródeł w internecie, aby mogła skutecznie działać w wielu różnorodnych zadaniach i kontekstach.

Jak firmy zarabiają na treściach użytkowników?

Google testuje nowe narzędzie AI. Automatycznie generuje artykuły z istniejących treści. Małym wydawcom płaci za testowanie i feedback. Eksperci martwią się o prawa autorskie. Narzędzie podsumowuje treści bez zgody autorów.

Twoje posty w internecie? Mogą być już wykorzystane. AI potrzebuje dużo danych. Często bez zgody autorów. OpenAI, Midjourney, Sora – wszystkie korzystają z ogromnych zbiorów danych.

Firmy takie jak The New York Times czy Getty Images podjęły kroki prawne przeciwko OpenAI i Stable Diffusion za naruszenie praw autorskich. Inne firmy, jak Associated Press czy Shutterstock, zawarły umowy z OpenAI. Dostarczają dane do szkolenia AI, w tym zdjęcia, filmy i muzykę.

Twoje posty na Tumblrze, Reddicie czy WordPressie mogą być sprzedawane dużym firmom AI. Automattic, właściciel Tumblr i WordPress, ogłosił możliwość wycofania zgody na udostępnianie treści. Mimo to, Tumblr i inne platformy są ważne dla twórców wszystkich treści.

Jest to bardzo trudna i skomplikowana sytuacja. Rozumiem frustrację ludzi, bo sam znajdę się w tym samym miejscu. Automattic, właściciel WordPressa i Tumblra, planuje sprzedaż treści z postów użytkowników. Oczywiście, na ten moment mowa tylko o serwisie WordPress.com, ale nie wykluczam, że może dojść do sytuacji, w której treści będą pobierane z każdej strony.

Dlaczego mamy prawo się wkurzyć?

To zaskakujące działanie. Tworzę treści w internecie, pokrywam koszty serwera, domeny, energii elektrycznej i tak dalej. Może nie zarabiam na tym, bo to moje hobby. Ale nagle WordPress zyskuje na moich tekstach. Potem OpenAI wykorzystuje je do trenowania swojej sztucznej inteligencji, która również generuje zyski. W tym całym łańcuchu to autor zostaje bez wynagrodzenia.

Reddit jest tu dobrym przykładem, ale można to odnieść również do polskiego podwórka, na przykład do Wykopu. Reddit sprzedał dostęp do swoich postów Google za 60 milionów dolarów. Umowa ta ma pomóc Google w szkoleniu modeli generatywnej AI.

Ogromne archiwa postów na Reddicie są tworzone dzięki pracy wolontariuszy: moderatorzy subreddita, którzy nie otrzymują wynagrodzenia, nadzorują społeczności złożone z użytkowników, którzy również piszą za darmo. Ich wspólna praca czyni platformę wartościową.

Do tego dochodzą kontrowersje z czerpaniem danych przez Gemini (wcześniej Bard) z treści, które są w usłudze Gmail. Swego czasu, ta sprawa też wywołała niemałe zamieszanie.

Polska sprawa

Wyobraźmy sobie teraz, jak podobna sytuacja rozgrywa się w polskiej części internetu. Użytkownicy Wykopu nie ograniczają się jedynie do dzielenia się znaleziskami – tworzą również mnóstwo wartościowych treści. Portal obfituje w interesujące artykuły, które stanowią prawdziwą skarbnicę wiedzy.

Chociaż Wykop nie jest dokładnym odpowiednikiem Reddita, wpływ sztucznej inteligencji na polski obszar internetowy byłby podobny. Wyobraźcie sobie, że Wykop zaczyna sprzedawać te treści wielkiej korporacji specjalizującej się w tworzeniu AI.

Obie firmy czerpałyby korzyści z generowania nowych materiałów opartych na wkładzie użytkowników. Tymczasem ci ostatni, mimo że dostarczają swoje prace zupełnie za darmo, nie otrzymaliby za to ani grosza.

Nie tylko takie umowy są problemem. Duże modele AI są już szkolone na Twoich postach w internecie. Meta używa publicznych postów z Facebooka i Instagrama do szkolenia swoich modeli AI.

Znane firmy technologiczne sprzedają Twoje dane sztucznej inteligencji. To fakt, z którym musimy się zmierzyć. Twoje dane, Twoje posty, mogą być wykorzystywane bez Twojej wiedzy i zgody. To budzi pytania o prywatność, prawa autorskie i kontrolę nad własnymi treściami.

Czy firmy technologiczne powinny płacić za treści, które wykorzystują do szkolenia AI? Co o tym myślicie?

Na blogu mogą pojawiać się linki partnerskie. Dzięki Tobie mogę być niezależny. To nic nie kosztuje. Dziękuję!

Dołącz do klubu Androidowy!
Jest nas 500+

* wymagane

Autor na blogu technologicznym Androidowy.pl Od ponad 13 lat w branży technologicznej. Technologia ma być praktyczna.

Skomentuj mój tekst