Google představuje neviditelný vodoznak pro texty generované umělou inteligencí
Google DeepMind vyvinul neviditelný vodoznak pro text generovaný umělou inteligencí, který má bojovat proti dezinformacím.

Google představuje neviditelný vodoznak pro texty generované umělou inteligencí
Vědci z Google DeepMind v Londýně vyvinuli „vodoznak“ pro neviditelné označení textu generovaného umělou inteligencí (AI) – ten už využily miliony uživatelů chatbotů.
Vodoznak, publikovaný 23. října v časopise Nature 1, není první vytvořený pro texty generované AI. Je však první, která byla demonstrována ve velkém měřítku, v kontextu reálného světa. „Myslím, že největší novinkou je, že to skutečně používají,“ říká Scott Aaronson, počítačový vědec z Texaské univerzity v Austinu, který až do srpna pracoval na vodoznaku ve společnosti OpenAI, tvůrci ChatGPT se sídlem v San Franciscu v Kalifornii.
Rozpoznávání textu generovaného umělou inteligencí je stále důležitější, protože představuje potenciální řešení problémů Falešné zprávy a akademický podvod představuje. Navíc by to mohlo přispět k Chraňte budoucí modely před devalvací tím, že je nebudete trénovat pomocí obsahu generovaného umělou inteligencí.
V obsáhlé studii uživatelé Google Gemini Large Language Model (LLM) hodnotili texty s vodoznakem jako ekvivalentní textům bez označení ve 20 milionech odpovědí. „Jsem nadšený, že Google tento krok pro technickou komunitu podnikne,“ řekl Furong Huang, počítačový vědec z University of Maryland v College Park. „Je pravděpodobné, že většina komerčních nástrojů bude v blízké budoucnosti obsahovat vodoznaky,“ dodává Zakhar Shumaylov, počítačový vědec z University of Cambridge ve Velké Británii.
Výběr slov
Je obtížnější aplikovat vodoznak na text než na obrázky, protože volba slova je v podstatě jedinou proměnnou, kterou lze změnit. Vodoznak DeepMind – nazývaný SynthID text – mění, která slova model volí tajným, ale vzorovým způsobem, který lze zachytit pomocí kryptografického klíče. Oproti jiným přístupům je vodoznak DeepMind o něco snáze detekovatelný a aplikace nezdržuje tvorbu textu. „Zdá se, že překonává přístupy konkurentů k vodoznakům LLM,“ říká Shumaylov, který je bývalým zaměstnancem a bratrem jednoho z autorů studie.
Nástroj byl také otevřen, takže vývojáři mohou na své modely použít vlastní vodoznak. „Doufáme, že ostatní vývojáři modelů umělé inteligence to přijmou a integrují do svých vlastních systémů,“ říká Pushmeet Kohli, počítačový vědec z DeepMind. Google udržuje svůj klíč v tajnosti, aby uživatelé nemohli používat detekční nástroje k identifikaci vodoznaku z modelu Gemini.
vlády nastavit o vodoznakech jako řešení pro distribuci textu generovaného umělou inteligencí. Přesto existuje mnoho problémů, včetně závazku vývojářů používat vodoznaky a koordinace jejich přístupů. Začátkem letošního roku to ukázali vědci ze Švýcarského federálního technologického institutu v Curychu jakýkoli vodoznak náchylný k odstranění je proces zvaný „scrubbing“ nebo „spoofing“, ve kterém jsou vodoznaky aplikovány na text, aby vyvolaly falešný dojem, že je generován AI.
Žetonový turnaj
Přístup DeepMind je založen na jednom stávající metoda, který integruje vodoznak do vzorkovacího algoritmu, což je krok při vytváření textu, který je oddělený od samotného LLM.
LLM je síť asociací vytvořená školením s miliardami slov nebo částí slov známých jako tokeny. Když je zadán text, model přiřadí každému tokenu v jeho slovníku pravděpodobnost, že bude dalším slovem ve větě. Úkolem vzorkovacího algoritmu je vybrat, který token použít podle sady pravidel.
Algoritmus vzorkování textu SynthID používá kryptografický klíč k přiřazení náhodných hodnot každému možnému tokenu. Kandidátské žetony jsou vylosovány z distribuce v poměru k jejich pravděpodobnosti a umístěny do „turnaje“. Tam algoritmus porovnává hodnoty v sérii vyřazovacích kol jeden na jednoho, přičemž nejvyšší hodnota vyhrává, dokud nezůstane pouze jeden token, který je vybrán pro text.
Tato sofistikovaná metoda usnadňuje detekci vodoznaku, protože stejný kryptografický kód je aplikován na generovaný text, aby se hledaly vysoké hodnoty, které označují „vítězné“ tokeny. To může také ztížit odstranění.
Na více kol v turnaji lze pohlížet jako na kombinaci zámku, kde každé kolo představuje jiné číslo, které musí být vyřešeno, aby se odemkl nebo odstranil vodoznak, říká Huang. „Tento mechanismus výrazně ztěžuje čištění, falšování nebo zpětnou analýzu vodoznaku,“ dodává. U textů s přibližně 200 tokeny autoři ukázali, že mohou stále detekovat vodoznak, i když byl k přepsání textu použit druhý LLM. Vodoznak je méně robustní pro kratší texty.
Vědci nezkoumali, jak dobře vodoznak odolává úmyslným pokusům o jeho odstranění. Odolnost vodoznaků proti takovým útokům je „rozsáhlá politická otázka,“ říká Yves-Alexandre de Montjoye, počítačový vědec z Imperial College London. „V kontextu zabezpečení AI není jasné, do jaké míry to poskytuje ochranu,“ vysvětluje.
Kohli doufá, že vodoznak zpočátku pomůže podpořit dobře míněné použití LLM. „Vůdčí filozofií bylo, že jsme chtěli vyvinout nástroj, který by komunita mohla vylepšit,“ dodává.
-
Dathathri, S. a kol. Příroda 634, 818–823 (2024).