AI-ga loodud pildid ohustavad teadust – nii tahavad teadlased neid ära tunda

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Teadlased võitlevad tehisintellekti loodud võltspiltide vastu teadusväljaannetes. Arenevad uued avastamismeetodid.

Forschende kämpfen gegen AI-generierte Fake-Bilder in wissenschaftlichen Publikationen. Neue Methoden zur Aufdeckung entwickeln sich.
Teadlased võitlevad tehisintellekti loodud võltspiltide vastu teadusväljaannetes. Arenevad uued avastamismeetodid.

AI-ga loodud pildid ohustavad teadust – nii tahavad teadlased neid ära tunda

Teadlased, kes manipuleerivad numbritega ja toodavad massiliselt võltspabereid Kohustuslikud kirjastajad – probleemsed käsikirjad on teaduskirjanduses pikka aega häirinud. Teadusdetektiivid töötavad väsimatult, et paljastada see süütegu ja parandada teaduslikke andmeid. Kuid nende töö muutub üha raskemaks, kuna petturitele on ilmunud uus võimas tööriist: generatiivne tehisintellekt (AI).

"Generatiivne AI areneb väga kiiresti," ütleb Jana Christopher, Saksamaal Heidelbergis asuva FEBS Pressi pildi terviklikkuse analüütik. „Minu piirkonnas töötavad inimesed – pildi terviklikkus ja avaldamispoliitika – on muutumas üha enam mures selle pakutavate võimaluste pärast.”

Lihtsus, millega generatiivsete AI tööriistade tekstid, pildid ja andmed tekitavad hirmu üha ebausaldusväärsema teaduskirjanduse ees, mis on üle ujutatud võltsnumbrite, käsikirjade ja järeldustega, mida inimestel on raske tuvastada. Juba on tekkimas võidurelvastumine, mille nimel aususe spetsialistid, kirjastajad ja tehnoloogiaettevõtted usinalt tööd teevad AI tööriistade väljatöötamine, mis aitab erialaartiklites kiiresti tuvastada petlikud tehisintellekti loodud elemendid.

"See on hirmutav areng," ütleb Christopher. "Kuid on ka nutikaid inimesi ja häid struktuurimuudatusi pakutakse välja."

Uuringute terviklikkuse eksperdid teatavad, et kuigi tehisintellektiga loodud tekst on juba teatud tingimustel paljudes ajakirjades lubatud, võib selliste tööriistade kasutamist piltide või muude andmete loomiseks pidada vähem vastuvõetavaks. "Lähitulevikus võime AI-ga loodud tekstiga hakkama saada," ütleb Elisabeth Bik, pildi kohtuekspertiisi spetsialist ja konsultant Californias San Franciscos. "Kuid ma tõmban andmete genereerimisele piiri."

Bik, Christopher ja teised viitavad sellele, et generatiivse tehisintellektiga loodud andmeid, sealhulgas pilte, kasutatakse kirjanduses juba laialdaselt ning kohustuslikud kirjastajad kasutavad tehisintellekti tööriistu mahuliste käsikirjade koostamiseks (vt „Viktoriin: kas saate märgata tehisintellekti võltsinguid?”).

Tehisintellektiga tehtud piltide tuvastamine kujutab endast tohutut väljakutset: neid on sageli peaaegu võimatu palja silmaga tegelikest piltidest eristada. "Meile tundub, et puutume iga päev AI-ga loodud piltidega kokku," ütleb Christopher. "Kuid kui te ei suuda seda tõestada, on teil tõesti väga vähe teha."

On mõned selged näited generatiivse AI kasutamisest teaduslikes piltides, näiteks nüüd kurikuulus pilt absurdselt suurte suguelunditega rotist ja mõttetud sildid, mis on loodud Midjourney pilditööriistaga. Ametiajakirja veebruaris avaldatud graafika tekitas sotsiaalmeedias tormi ja oligi paar päeva hiljem tagasi võetud.

Enamik juhtumeid pole aga nii ilmsed. Figuurid, mis on loodud Adobe Photoshopi või sarnaste tööriistadega enne generatiivse AI tulekut – eriti molekulaar- ja rakubioloogias – sisaldavad sageli silmatorkavaid tunnuseid, mida detektiivid võivad ära tunda, nagu identne taust või ebatavaline triipude või täppide puudumine. AI-ga loodud tegelased sageli selliseid omadusi ei näita. "Ma näen palju pabereid, mis panevad mind arvama, et need Western blot'id ei näe tõelised välja, kuid seal pole suitsupüstolit," ütleb Bik. "Võid vaid öelda, et nad näevad lihtsalt imelikud välja ja loomulikult ei piisa sellest tõendist, et toimetusega ühendust võtta."

Siiski on märke, et avaldatud käsikirjadesse ilmuvad tehisintellekti loodud tegelased. Selliste tööriistade nagu ChatGPT abil kirjutatud tekstide arv kasvab artiklites, mida näitavad tüüpilised vestlusrobotite fraasid, mille autorid unustavad eemaldada, ja eristavad sõnad, mida AI mudelid tavaliselt kasutavad. "Seega peame eeldama, et see juhtub ka andmete ja piltide puhul, " ütleb Bik.

Veel üks märk sellest, et petturid kasutavad keerukaid pilditöötlustööriistu, on see, et enamik uurijate poolt praegu leitud probleeme ilmneb mitu aastat vanades teostes. "Viimastel aastatel oleme näinud piltidega üha vähem probleeme," ütleb Bik. "Ma arvan, et enamik inimesi, kes tabati piltidega manipuleerimisega, hakkasid looma puhtamaid pilte."

Puhaste piltide loomine generatiivse tehisintellektiga pole keeruline. Kevin Patrick, sotsiaalmeedias Cheshire'i nime all tuntud teaduslik pildidetektiiv, on näidanud, kui lihtne see võib olla, ja avaldas oma leiud saidil X. Kasutades Photoshopi AI tööriista Generative Fill, lõi Patrick realistlikud kujutised – mis võivad ilmuda teaduslikes paberites – kasvajatest, rakukultuuridest, Western blot’idest ja muust. Enamiku piltide loomiseks kulus vähem kui minut (vt „Valeteaduse loomine”).

"Kui ma saan seda teha, siis kindlasti teevad seda ka need, kellele makstakse võltsandmete loomise eest," ütleb Patrick. "Tõenäoliselt on palju muid andmeid, mida saab selliste tööriistade abil genereerida."

Mõned kirjastajad teatavad, et on leidnud avaldatud uuringutes tõendeid tehisintellekti loodud sisu kohta. See hõlmab PLoS-i, mida on hoiatatud kahtlasest sisust ja mis leidis sisejuurdluste kaudu tõendeid tehisintellekti loodud teksti ja andmete kohta artiklites ja esildistes, ütleb California osariigis San Franciscos asuva PLoS-i avaldamiseetika meeskonna toimetaja Renée Hoch. (Hoch märgib, et AI kasutamine ei ole PLoS-i ajakirjades keelatud ja et AI poliitika põhineb autori vastutusel ja läbipaistval avalikustamisel.)

Teised tööriistad võivad pakkuda võimalusi inimestele, kes soovivad luua võltsitud sisu. Eelmisel kuul avaldasid teadlased a 1 generatiivne AI mudel kõrglahutusega mikroskoobipiltide loomiseks – ja mõned terviklikkuse spetsialistid väljendasid selle töö pärast muret. "Seda tehnoloogiat saavad halbade kavatsustega inimesed hõlpsasti kasutada sadade või tuhandete võltspiltide kiireks loomiseks," ütleb Bik.

Tööriista looja Yoav Shechtman Technion-Israeli Tehnoloogiainstituudist Haifas ütleb, et tööriist on kasulik mudelite koolitusandmete loomiseks, kuna kõrge eraldusvõimega mikroskoobi kujutisi on raske saada. Kuid ta lisab, et see pole võltsingute genereerimiseks kasulik, kuna kasutajatel on tulemuste üle vähe kontrolli. Olemasolev pilditöötlustarkvara, nagu Photoshop, on figuuridega manipuleerimiseks kasulikum, soovitab ta.

Kuigi inimsilmad ei pruugi seda teha Tuvastage AI-ga loodud pildid, AI võib seda teha (vt "AI-pilte on raske ära tunda").

Tööriistade, nagu Imagetwin ja Proofig, arendajad, mis kasutavad tehisintellekti teaduslike piltide terviklikkuse probleemide tuvastamiseks, laiendavad oma tarkvara generatiivse AI abil loodud piltide filtreerimiseks. Kuna selliseid pilte on nii raske ära tunda, loovad mõlemad ettevõtted oma generatiivsete AI-piltide andmebaase, et oma algoritme treenida.

Proofig on oma tööriistas juba välja andnud funktsiooni AI-ga loodud mikroskoobipiltide tuvastamiseks. Iisraelis Rehovotis asuv kaasasutaja Dror Kolodkin-Gal ütleb, et katsetades tuhandete tehisintellekti loodud ja reaalsete artiklite piltidega, tuvastas algoritm 98% juhtudest õigesti tehisintellekti kujutised ja selle valepositiivsuse määr oli 0,02%. Dror lisab, et meeskond püüab nüüd aru saada, mida nende algoritm täpselt tuvastab.

"Mul on nende tööriistade suhtes suured lootused," ütleb Christopher. Siiski märgib ta, et nende tulemusi peavad alati hindama eksperdid, kes saavad kontrollida nende näidatud probleeme. Christopher pole veel näinud tõendeid selle kohta, et tehisintellekti pildituvastustarkvara on usaldusväärne (Proofigi sisehinnang pole veel avaldatud). Need tööriistad on "piiratud, kuid kindlasti väga kasulikud, et saaksime oma taotluste läbivaatamise jõupingutusi laiendada," lisab ta.

Paljud kirjastajad ja teadusasutused seda juba kasutavad Tõestus ja Imagetwin. Näiteks teadusajakirjad kasutavad piltide terviklikkuse probleemide kontrollimiseks Proofigi. Washingtoni DC teaduse kommunikatsioonidirektori Meagan Phelani sõnul ei ole tööriist veel avastanud ühtegi AI-ga loodud pilti.

Nature'i kirjastaja Springer Nature töötab välja oma teksti- ja pildituvastustööriistu, mida nimetatakse Geppetto ja SnapShot, mis märgivad ebakorrapärasusi, mida inimesed seejärel hindavad. (Loodusuudiste meeskond on toimetuse poolest oma väljaandjast sõltumatu.)

Avaldamisrühmad võtavad meetmeid ka tehisintellekti loodud piltidele reageerimiseks. Ühendkuningriigis Oxfordis asuva rahvusvahelise teadus-, tehnika- ja meditsiinikirjastajate assotsiatsiooni (STM) pressiesindaja ütles, et ta võtab probleemi "väga tõsiselt" ja reageerib sellistele algatustele nagu United2Act ja STM Integrity Hub, mis käsitleb jooksvaid kohustusliku avaldamise ja muid akadeemilise terviklikkuse probleeme.

Christopher, kes juhib kujutiste muutmise ja dubleerimisega tegelevat STM-i töörühma, ütleb, et on kasvav teadlikkus sellest, et on vaja välja töötada viise algandmete kontrollimiseks – näiteks märgistada mikroskoobiga tehtud pildid nähtamatute vesimärkidega, mis sarnanevad kasutatud vesimärkidega. Vesimärgid tehisintellekti loodud tekstides – see võib olla õige tee. See nõuab seadmetootjatelt uusi tehnoloogiaid ja uusi standardeid, lisab ta.

Patrick ja teised muretsevad, et kirjastajad ei tegutse ohuga tegelemiseks piisavalt kiiresti. "Kardame, et see on lihtsalt järjekordne kirjandusprobleemide põlvkond, mida nad ei käsitle enne, kui on liiga hilja," ütleb ta.

Siiski on mõned optimistlikud, et AI-ga loodud sisu, mis täna artiklites ilmub, avastatakse tulevikus.

"Ma olen täiesti kindel, et tehnoloogia paraneb nii kaugele, et see tuvastab täna loodavad andmed, sest mingil hetkel peetakse seda suhteliselt jämedaks," ütleb Patrick. "Petturid ei tohiks öösel hästi magada. Nad võivad praeguse protsessi lollitada, aga ma ei usu, et nad suudavad seda protsessi igavesti petta."

  1. Saguy, A. et al. Väike Meth. https://doi.org/10.1002/smtd.202400672 (2024).

    Artikkel  

    Google Scholar
     

Laadige alla viited