Google pakub tehisintellektiga loodud tekstidele nähtamatut vesimärki
Google DeepMind on valeinformatsiooni vastu võitlemiseks välja töötanud AI-ga loodud teksti jaoks nähtamatu vesimärgi.

Google pakub tehisintellektiga loodud tekstidele nähtamatut vesimärki
Londoni Google DeepMindi teadlased töötasid välja tehisintellekti (AI) loodud teksti nähtamatult märkimiseks "vesimärgi" – seda on juba kasutanud miljonid vestlusroboti kasutajad.
Vesimärk, avaldatud 23. oktoobril ajakirjas Nature 1, ei ole esimene AI-ga loodud tekstide jaoks loodud. Siiski on see esimene, mida demonstreeritakse suuremahulises reaalses kontekstis. "Ma arvan, et suurim uudis siin on see, et nad seda tegelikult kasutavad," ütleb Austini Texase ülikooli arvutiteadlane Scott Aaronson, kes töötas kuni augustini vesimärgistamise kallal OpenAI-s, ChatGPT tegijas San Franciscos, Californias.
AI-ga loodud tekstituvastus muutub üha olulisemaks, kuna see kujutab endast potentsiaalset lahendust probleemidele Valeuudised ja akadeemiline pettus esindab. Lisaks võiks see kaasa aidata Kaitske tulevasi mudeleid devalveerimise eest, mitte treenides neid tehisintellekti loodud sisuga.
Põhjalikus uuringus hindasid Google Gemini Large Language Model (LLM) kasutajad 20 miljoni vastuse puhul vesimärgiga tekste samaväärseks märgistamata tekstidega. "Mul on hea meel näha, et Google astub selle sammu tehnikakogukonna heaks," ütles College Parkis asuva Marylandi ülikooli arvutiteadlane Furong Huang. "On tõenäoline, et enamik kaubanduslikke tööriistu sisaldavad lähitulevikus vesimärke," lisab Zakhar Shumaylov, Ühendkuningriigi Cambridge'i ülikooli arvutiteadlane.
Sõnade valik
Vesimärki on tekstile raskem rakendada kui piltidele, sest sõnavalik on sisuliselt ainus muutuja, mida saab muuta. DeepMindi vesimärk – nimega SynthID tekst – muudab, milliseid sõnu mudel valib salajasel, kuid valemil viisil, mida saab krüptograafilise võtmega tabada. Võrreldes teiste lähenemisviisidega on DeepMindi vesimärki veidi lihtsam tuvastada ja rakendus ei viivita teksti loomist. "Tundub, et see ületab konkurentide lähenemisviise LLM-ide vesimärgistamisele," ütleb Shumaylov, kes on ühe uuringu autori endine töötaja ja vend.
Tööriist on avatud ka selleks, et arendajad saaksid oma mudelitele oma vesimärgi rakendada. "Loodame, et teised AI-mudelite arendajad võtavad selle kasutusele ja integreerivad selle oma süsteemidesse," ütleb DeepMindi arvutiteadlane Pushmeet Kohli. Google hoiab oma võtme saladuses, et kasutajad ei saaks kasutada tuvastustööriistu Gemini mudeli vesimärgiga teksti tuvastamiseks.
valitsused seavad vesimärkide kohta AI-ga loodud teksti levitamise lahendusena. Siiski on palju probleeme, sealhulgas arendajate pühendumus vesimärkide kasutamisele ja nende lähenemisviiside kooskõlastamine. Selle aasta alguses näitasid seda Zürichi Šveitsi föderaalse tehnoloogiainstituudi teadlased kõik vesimärgid, mida võib eemaldada on protsess, mida nimetatakse "puhastamiseks" või "võltsimiseks", mille käigus kantakse tekstile vesimärke, et jätta mulje, et see on AI loodud.
Tokenturniir
DeepMindi lähenemine põhineb ühel olemasolev meetod, mis integreerib vesimärgi diskreetimisalgoritmi, teksti loomise etappi, mis on LLM-ist eraldiseisev.
LLM on assotsiatsioonide võrgustik, mis on üles ehitatud miljardeid sõnu või sõnaosi, mida tuntakse märkidena, treenides. Teksti sisestamisel määrab mudel igale oma sõnavara märgile tõenäosuse, et see on lause järgmine sõna. Valimialgoritmi ülesanne on vastavalt reeglistikule valida, millist tunnust kasutada.
SynthID teksti proovivõtu algoritm kasutab krüptograafilist võtit, et määrata igale võimalikule märgile juhuslikud väärtused. Kandidaatide märgid võetakse jaotusest välja proportsionaalselt nende tõenäosusega ja paigutatakse "turniirile". Seal võrdleb algoritm väärtusi üks-ühele väljalangemisvoorude seerias, kusjuures suurim väärtus võidab seni, kuni järele jääb ainult üks märk, mis valitakse teksti jaoks.
See keerukas meetod muudab vesimärkide tuvastamise lihtsamaks, kuna genereeritud tekstile rakendatakse sama krüptokoodi, et otsida kõrgeid väärtusi, mis viitavad "võitvatele" märkidele. See võib samuti raskendada eemaldamist.
Turniiri mitut vooru võib vaadelda lukukombinatsioonina, kus iga voor tähistab erinevat numbrit, mis tuleb vesimärgi avamiseks või eemaldamiseks lahendada, ütleb Huang. "See mehhanism muudab vesimärgi puhastamise, võltsimise või pöördprojekteerimise oluliselt keerulisemaks," lisab ta. Umbes 200 märgiga tekstide puhul näitasid autorid, et nad suudavad vesimärgi tuvastada isegi siis, kui teksti ümberkirjutamiseks kasutati teist LLM-i. Vesimärk on lühemate tekstide puhul vähem vastupidav.
Teadlased ei ole uurinud, kui hästi vesimärk peab vastu tahtlikele katsetele seda eemaldada. Vesimärkide vastupidavus selliste rünnakute vastu on "massiline poliitiline küsimus", ütleb Londoni Imperial College'i arvutiteadlane Yves-Alexandre de Montjoye. "AI turvalisuse kontekstis on ebaselge, mil määral see kaitset pakub, " selgitab ta.
Kohli loodab, et vesimärk aitab esialgu toetada LLM-ide heade kavatsustega kasutamist. "Juhendav filosoofia oli see, et tahtsime välja töötada tööriista, mida kogukond saaks täiustada," lisab ta.
-
Dathathri, S. et al. Nature 634, 818–823 (2024).