Google predstavlja nevidljivi vodeni žig za tekstove generirane umjetnom inteligencijom
Google DeepMind razvio je nevidljivi vodeni žig za tekst generiran umjetnom inteligencijom za borbu protiv dezinformacija.

Google predstavlja nevidljivi vodeni žig za tekstove generirane umjetnom inteligencijom
Istraživači Google DeepMinda u Londonu razvili su "vodeni žig" za nevidljivo označavanje teksta koji je generirala umjetna inteligencija (AI) - to su već koristili milijuni korisnika chatbota.
Vodeni žig, objavljen 23. listopada u časopisu Nature 1, nije prvi stvoren za tekstove generirane umjetnom inteligencijom. Međutim, prvi je koji je prikazan u kontekstu velikih razmjera u stvarnom svijetu. "Mislim da je najveća novost ovdje da ga oni zapravo koriste", kaže Scott Aaronson, računalni znanstvenik sa Sveučilišta Texas u Austinu koji je do kolovoza radio na vodenom žigu u OpenAI-u, proizvođaču ChatGPT-a sa sjedištem u San Franciscu, Kalifornija.
Prepoznavanje teksta generirano umjetnom inteligencijom postaje sve važnije jer predstavlja potencijalno rješenje za probleme Lažne vijesti i akademska prijevara predstavlja. Osim toga, moglo bi doprinijeti Zaštitite buduće modele od obezvrjeđivanja tako da ih ne obučavate sadržajem generiranim umjetnom inteligencijom.
U opsežnoj studiji, korisnici Google Gemini Large Language Model (LLM) ocijenili su tekstove s vodenim žigom kao ekvivalentne neoznačenim tekstovima u 20 milijuna odgovora. "Uzbuđen sam što vidim da Google poduzima ovaj korak za tehnološku zajednicu", rekao je Furong Huang, informatičar na Sveučilištu Maryland u College Parku. "Vjerojatno će većina komercijalnih alata uključivati vodene žigove u bliskoj budućnosti", dodaje Zakhar Shumaylov, informatičar sa Sveučilišta u Cambridgeu, UK.
Izbor riječi
Teže je primijeniti vodeni žig na tekst nego na slike jer je odabir riječi u biti jedina varijabla koja se može promijeniti. DeepMindov vodeni žig - nazvan SynthID text - mijenja koje riječi model odabire na tajan, ali formulatičan način koji se može uhvatiti kriptografskim ključem. U usporedbi s drugim pristupima, vodeni žig DeepMinda malo je lakše otkriti i aplikacija ne odgađa stvaranje teksta. "Čini se da nadmašuje pristupe konkurenata za označavanje vodenim žigom LLM-a", kaže Shumaylov, koji je bivši zaposlenik i brat jednog od autora studije.
Alat je također otvoren tako da programeri mogu primijeniti vlastiti vodeni žig na svoje modele. "Nadamo se da će drugi razvijači modela umjetne inteligencije ovo usvojiti i integrirati u svoje vlastite sustave", kaže Pushmeet Kohli, računalni znanstvenik u DeepMindu. Google čuva svoj ključ u tajnosti kako korisnici ne bi mogli koristiti alate za otkrivanje za prepoznavanje teksta s vodenim žigom iz modela Gemini.
vlade postavljene o vodenim žigovima kao rješenju za distribuciju teksta generiranog umjetnom inteligencijom. Ipak, postoje mnogi problemi, uključujući posvećenost programera korištenju vodenih žigova i koordinaciju njihovih pristupa. Početkom ove godine to su pokazali istraživači Švicarskog saveznog instituta za tehnologiju u Zürichu bilo koji vodeni žig osjetljiv na uklanjanje je, proces koji se zove "ribanje" ili "podvala", u kojem se vodeni žigovi primjenjuju na tekst kako bi se stvorio lažni dojam da je generiran umjetnom inteligencijom.
Token turnir
Pristup DeepMinda temelji se na jednom postojeća metoda, koji integrira vodeni žig u algoritam uzorkovanja, korak u stvaranju teksta koji je odvojen od samog LLM-a.
LLM je mreža asocijacija izgrađena obukom s milijardama riječi ili dijelova riječi poznatih kao tokeni. Kada se unese tekst, model svakom tokenu u svom vokabularu dodjeljuje vjerojatnost da će biti sljedeća riječ u rečenici. Zadatak algoritma uzorkovanja je odabrati koji token koristiti prema skupu pravila.
Algoritam uzorkovanja teksta SynthID koristi kriptografski ključ za dodjelu nasumičnih vrijednosti svakom mogućem tokenu. Žetoni kandidati izvlače se iz distribucije proporcionalno njihovoj vjerojatnosti i stavljaju u "turnir". Tamo algoritam uspoređuje vrijednosti u nizu knockout rundi jedan na jedan, pri čemu pobjeđuje najveća vrijednost dok ne ostane samo jedan token, koji je odabran za tekst.
Ova sofisticirana metoda olakšava otkrivanje vodenog žiga jer se isti kriptografski kod primjenjuje na generirani tekst kako bi se potražile visoke vrijednosti koje označavaju "pobjedničke" tokene. To također može otežati uklanjanje.
Višestruke runde na turniru mogu se promatrati kao kombinacija zaključavanja, gdje svaka runda predstavlja drugačiji broj koji se mora riješiti da bi se otključao ili uklonio vodeni žig, kaže Huang. "Ovaj mehanizam znatno otežava čišćenje, lažiranje ili obrnuti inženjering vodenog žiga", dodaje ona. Za tekstove s oko 200 tokena, autori su pokazali da još uvijek mogu otkriti vodeni žig čak i kada je drugi LLM korišten za ponovno pisanje teksta. Vodeni žig je manje robustan za kraće tekstove.
Istraživači nisu ispitali koliko se dobro vodeni žig odupire namjernim pokušajima uklanjanja. Otpornost vodenih žigova na takve napade je "veliko političko pitanje", kaže Yves-Alexandre de Montjoye, računalni znanstvenik s Imperial Collegea u Londonu. “U kontekstu sigurnosti umjetne inteligencije, nejasno je u kojoj mjeri to pruža zaštitu”, objašnjava.
Kohli se nada da će vodeni žig u početku pomoći u podršci dobronamjernoj upotrebi LLM-ova. "Filozofija vodilja bila je da želimo razviti alat koji bi zajednica mogla poboljšati", dodaje.
-
Dathathri, S. i sur. Nature 634, 818-823 (2024).