Google predstavlja nevidni vodni žig za besedila, ustvarjena z umetno inteligenco
Google DeepMind je za boj proti dezinformacijam razvil nevidni vodni žig za besedilo, ki ga ustvari umetna inteligenca.

Google predstavlja nevidni vodni žig za besedila, ustvarjena z umetno inteligenco
Raziskovalci pri Google DeepMind v Londonu so razvili "vodni žig" za nevidno označevanje besedila, ki ga je ustvarila umetna inteligenca (AI) - to je že uporabilo na milijone uporabnikov chatbotov.
Vodni žig, objavljen 23. oktobra v reviji Nature 1, ni prvi, ustvarjen za besedila, ustvarjena z umetno inteligenco. Vendar pa je prvi, ki je bil prikazan v obsežnem kontekstu resničnega sveta. »Mislim, da je največja novica tukaj ta, da ga dejansko uporabljajo,« pravi Scott Aaronson, računalniški znanstvenik na teksaški univerzi v Austinu, ki je do avgusta delal na vodnem žigu pri OpenAI, izdelovalcih ChatGPT s sedežem v San Franciscu v Kaliforniji.
Prepoznavanje besedila, ki ga ustvari umetna inteligenca, postaja vse bolj pomembno, saj predstavlja potencialno rešitev za težave Lažne novice in akademska goljufija predstavlja. Poleg tega bi lahko prispeval k Zaščitite prihodnje modele pred razvrednotenjem tako, da jih ne usposabljate z vsebino, ki jo ustvari umetna inteligenca.
V obsežni študiji so uporabniki Google Gemini Large Language Model (LLM) v 20 milijonih odgovorov besedila z vodnim žigom ocenili kot enakovredna neoznačenim besedilom. "Navdušen sem, ko vidim, da je Google naredil ta korak za tehnološko skupnost," je dejal Furong Huang, računalniški znanstvenik na univerzi Maryland v College Parku. "Verjetno bo večina komercialnih orodij v bližnji prihodnosti vključevala vodne žige," dodaja Zakhar Shumaylov, računalniški znanstvenik z univerze v Cambridgeu v Veliki Britaniji.
Izbira besed
Na besedilo je težje uporabiti vodni žig kot na slike, ker je izbira besede v bistvu edina spremenljivka, ki jo je mogoče spremeniti. DeepMindov vodni žig – imenovan besedilo SynthID – spreminja, katere besede model izbere na skrivni, a formulatičen način, ki ga je mogoče zajeti s kriptografskim ključem. V primerjavi z drugimi pristopi je vodni žig DeepMinda nekoliko lažje zaznati in aplikacija ne zadrži ustvarjanja besedila. »Zdi se, da prekaša pristope konkurentov k označevanju vodnih žigov LLM,« pravi Shumaylov, ki je nekdanji uslužbenec in brat enega od avtorjev študije.
Orodje je bilo odprto tudi tako, da lahko razvijalci na svoje modele uporabijo svoj vodni žig. »Upamo, da bodo drugi razvijalci modelov AI to sprejeli in integrirali v svoje sisteme,« pravi Pushmeet Kohli, računalniški znanstvenik pri DeepMind. Google ohranja svojo ključno skrivnost, tako da uporabniki ne morejo uporabiti orodij za odkrivanje za prepoznavanje besedila z vodnim žigom iz modela Gemini.
vlade o vodnih žigih kot rešitvi za distribucijo besedila, ustvarjenega z umetno inteligenco. Kljub temu je veliko težav, vključno z zavezanostjo razvijalcev uporabi vodnih žigov in usklajevanjem njihovih pristopov. To so v začetku letošnjega leta pokazali raziskovalci švicarskega zveznega inštituta za tehnologijo v Zürichu vsak vodni žig, ki ga je mogoče odstraniti je postopek, imenovan »čiščenje« ali »spoofing«, pri katerem se na besedilo nanesejo vodni žigi, da se ustvari napačen vtis, da je ustvarjeno z umetno inteligenco.
Žetonski turnir
DeepMindov pristop temelji na enem obstoječa metoda, ki integrira vodni žig v algoritem vzorčenja, korak pri ustvarjanju besedila, ki je ločen od samega LLM.
LLM je mreža asociacij, zgrajena z usposabljanjem z milijardami besed ali delov besed, znanih kot žetoni. Ko je besedilo vneseno, model vsakemu žetonu v svojem besednjaku dodeli verjetnost, da bo naslednja beseda v stavku. Naloga algoritma za vzorčenje je izbrati, kateri žeton uporabiti v skladu z nizom pravil.
Algoritem za vzorčenje besedila SynthID uporablja kriptografski ključ za dodelitev naključnih vrednosti vsakemu možnemu žetonu. Žetoni kandidatov so izžrebani iz porazdelitve sorazmerno z njihovo verjetnostjo in uvrščeni na »turnir«. Tam algoritem primerja vrednosti v seriji izločilnih krogov ena na ena, pri čemer zmaga najvišja vrednost, dokler ne ostane samo en žeton, ki je izbran za besedilo.
Ta sofisticirana metoda olajša odkrivanje vodnega žiga, ker se ista kriptografska koda uporabi za ustvarjeno besedilo za iskanje visokih vrednosti, ki označujejo "zmagovalne" žetone. To lahko oteži tudi odstranitev.
Več krogov na turnirju je mogoče obravnavati kot kombinacijo ključavnic, kjer vsak krog predstavlja drugo število, ki ga je treba rešiti, da odklenete ali odstranite vodni žig, pravi Huang. »Ta mehanizem bistveno oteži čiščenje, ponarejanje ali obratno inženirstvo vodnega žiga,« dodaja. Za besedila s približno 200 žetoni so avtorji pokazali, da še vedno lahko zaznajo vodni žig, tudi če je bil za ponovno pisanje besedila uporabljen drugi LLM. Vodni žig je manj robusten za krajša besedila.
Raziskovalci niso preučili, kako dobro se vodni žig upira namernim poskusom, da bi ga odstranili. Odpornost vodnih žigov proti takim napadom je "veliko politično vprašanje," pravi Yves-Alexandre de Montjoye, računalniški znanstvenik na Imperial College London. "V kontekstu varnosti umetne inteligence ni jasno, v kolikšni meri to zagotavlja zaščito," pojasnjuje.
Kohli upa, da bo vodni žig na začetku pomagal podpirati dobronamerno uporabo LLM. »Vodilna filozofija je bila, da želimo razviti orodje, ki bi ga lahko izboljšala skupnost,« dodaja.
-
Dathathri, S. et al. Narava 634, 818–823 (2024).