ChatGPT gre za dva: Kako je AI chatbot spremenil življenja znanstvenikov

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

ChatGPT je star dve leti in revolucionira raziskave: kako je AI chatbot spremenil življenja znanstvenikov.

ChatGPT wird zwei Jahre alt und revolutioniert die Forschung: Wie der AI-Chatbot das Leben von Wissenschaftlern verändert hat.
ChatGPT je star dve leti in revolucionira raziskave: kako je AI chatbot spremenil življenja znanstvenikov.

ChatGPT gre za dva: Kako je AI chatbot spremenil življenja znanstvenikov

V dveh letih od takrat Skupna raba ChatGPT javnosti, raziskovalci z njim sporočajo svoje izboljšati znanstvena besedila, pregledovati znanstveno literaturo in Napišite kodo za analizo podatkov. Medtem ko nekateri menijo, da je chatbot, ki je postal priljubljen 30. novembra 2022, povečuje produktivnost znanstvenikov, drugi se bojijo, da ga Plagiatorstvo postalo lažje, vnaša netočnosti v raziskovalne članke in porabi velike količine energije.

Založniška hiša Wiley s sedežem v Hobokenu v New Jerseyju je marca in aprila anketirala 1043 raziskovalcev o njihovi uporabi generativnih orodij AI, kot je ChatGPT, in delila predhodne rezultate z Nature. Osemdeset odstotkov vprašanih je poročalo, da uporabljajo ChatGPT osebno ali poklicno, zaradi česar je najbolj razširjeno orodje med akademiki. Tri četrtine vprašanih je menilo, da bo v naslednjih 5 letih pomembno, da raziskovalci razvijejo zmogljivosti AI za opravljanje svojega dela.

»Obdelovalniki besedil z umetno inteligenco so obstajali že prej, vendar se je z izdajo teh zelo zmogljivih velikih jezikovnih modelov zgodil pomemben premik,« pojasnjuje James Zou, raziskovalec umetne inteligence na univerzi Stanford v Kaliforniji. Klepetalni robot ChatGPT, ki ga je razvilo tehnološko podjetje OpenAI s sedežem v San Franciscu, je bil katalizator te spremembe.

Da bi obeležili drugi rojstni dan ChatGPT, je Nature zbral podatke o uporabi in se pogovarjal z znanstveniki o tem, kako je ChatGPT spremenil raziskovalno krajino.

ChatGPT v številkah

  • 60.000: Die Mindestanzahl an wissenschaftlichen Arbeiten, die 2023 veröffentlicht wurden und voraussichtlich mit Hilfe eines großen Sprachmodells (LLM) verfasst wurden 1. Dies entspricht etwas mehr als 1 % aller Artikel in der von dem Forschungsteam untersuchten Dimensions-Datenbank akademischer Veröffentlichungen.
  • 10 %: Der Mindestanteil der Forschungspapiere, die von Mitgliedern der biomedizinischen Gemeinschaft in der ersten Jahreshälfte 2024 veröffentlicht wurden und voraussichtlich ihre Abstracts mit Unterstützung eines LLM verfasst haben 2. Eine andere Studie schätzte diesen Anteil für die Informatikgemeinde im Februar sogar auf höhere 17.5 % 3.
  • 6.5–16.9 %: Der geschätzte Anteil der Peer-Reviews, die 2023 und 2024 an einer Auswahl von Top-AI-Konferenzen eingereicht wurden und vermutlich erheblich von LLMs generiert wurden 4. Diese Bewertungen beurteilen Forschungspapiere oder Präsentationen, die für die Konferenzen vorgeschlagen werden.

Pomočnik pri pisanju

Vse te številke, določene z vrednotenjem vzorcev in ključnih besed v besedilih, ki so značilni za LLM, so verjetno konzervativne ocene, pravi Debora Weber-Wulff, računalniška znanstvenica in raziskovalka plagiatorstva pri HTW Berlin. Njihovo delo kaže, da orodja za odkrivanje pogosto ne uspejo, ko je treba ugotoviti, ali je bil članek napisan s pomočjo AI 5.

V zadnjih dveh letih so raziskovalci ugotovili, da uporaba ChatGPT za ustvarjanje izvlečkov ter vlog za nepovratna sredstva in pisem podpore za študente omogoča, da se osredotočijo na kompleksne naloge. "Stvari, ki so vredne našega časa, so težka vprašanja in ustvarjalne hipoteze," pravi Milton Pividori, medicinski informatik na Medicinski fakulteti Univerze Colorado v Aurori.

Raziskovalci poročajo, da so LLM še posebej koristni pri premagovanju jezikovnih ovir. »Demokratizira pisanje in pomaga ljudem, ki jim je angleščina drugi jezik,« pojasnjuje Gabe Gomes, kemik na univerzi Carnegie Mellon v Pittsburghu v Pensilvaniji. Analiza, objavljena na strežniku za prednatis SSRN pred strokovnim pregledom novembra, je pokazala, da se je kakovost pisanja v prispevkih avtorjev, katerih prvi jezik ni angleščina, izboljšala po objavi ChatGPT, bolj kot pisanje avtorjev, ki tekoče govorijo angleščino. 6.

Od izdaje leta 2022 je bil ChatGPT deležen več nadgradenj. GPT-4, objavljeno marca 2023, je uporabnike navdušil s svojo zmožnostjo ustvarjanja besedil, podobnih človeškim. Najnovejši model, o1, ki je bil objavljen septembra in je na voljo nekaterim plačljivim strankam ter določenim razvijalcem pri testiranju, OpenAI pravi, da lahko "analizira zapletene naloge in rešuje težje probleme kot prejšnji modeli v znanosti, programiranju in matematiki." Kyle Kabasares, podatkovni znanstvenik na Bay Area Environmental Research Institute v Moffett Fieldu v Kaliforniji, je uporabil o1 za reproducirati kodo iz svojega doktorskega projekta. Ko je vnesel informacije iz razdelka o metodah svojega raziskovalnega dela, je sistem AI napisal kodo v samo eni uri, za ustvarjanje katere je potreboval skoraj eno leto podiplomskega študija.

Omejitve in potencial

Eno področje, kjer so bili ChatGPT in podobni sistemi AI manj uspešni, je izvajanje pregledov literature, pravi Pividori. »V resnici nam ne pomagajo, da bi bili bolj produktivni,« pojasnjuje, ker mora raziskovalec v celoti prebrati in razumeti ustrezne članke. »Če članek ni osrednjega pomena za vaše raziskave, ga boste morda lahko povzeli z orodji AI,« dodaja. Vendar se je pokazalo, da LLM halucinirajo 7 – to pomeni, da sestavljajo informacije. Lahko bi na primer govorili o številkah, ki v članku sploh ne obstajajo.

Druga skrb raziskovalcev pri uporabi LLM je varstvo podatkov. Na primer, ko znanstveniki vnesejo neobjavljene izvirne podatke v eno od teh orodij AI za pisanje prispevka, obstaja tveganje, da bo vsebina uporabljena za usposabljanje posodobljenih različic teh modelov. "To so črne skrinjice," pojasnjuje Weber-Wulff. "Nimate pojma, kaj se zgodi s podatki, ki jih naložite tja."

Da bi se izognili temu tveganju, nekateri raziskovalci namesto ChatGPT izberejo manjše lokalne modele. »Zaženete ga v računalniku in nič se ne deli navzven,« pravi Pividori. Dodaja, da nekateri naročniški načrti ChatGPT zagotavljajo, da se vaši podatki ne uporabljajo za usposabljanje modela.

Veliko vprašanje, s katerim so se raziskovalci ukvarjali zadnje leto, je, ali bo ChatGPT presegel vlogo virtualnega pomočnika in znanstvenik AI lahko. Nekatera zgodnja prizadevanja kažejo, da je to mogoče. Zou vodi razvoj virtualnega laboratorija, v katerem različni LLM-ji prevzamejo vlogo znanstvenikov v interdisciplinarni ekipi, medtem ko človeški znanstvenik zagotavlja povratne informacije na visoki ravni. "Sodelujejo pri oblikovanju novih raziskovalnih projektov," pravi. Prejšnji mesec so Zou in njegovi kolegi objavili rezultate enega od teh projektov na strežniku za prednatis bioRxiv pred strokovnim pregledom 8. Virtualni laboratorij je zasnoval nanotelesa – vrsto majhnih protiteles – ki se lahko vežejo na različice koronavirusa SARS-CoV-2, ki je povzročil pandemijo COVID-19. Človeški raziskovalci so s poskusi potrdili delo in identificirali dva obetavna kandidata za nadaljnje študije.

Gomes in njegovi kolegi so prav tako navdušeni nad možnostjo uporabe ChatGPT v laboratoriju. Ona uporabite orodje za izvajanje več kemijskih reakcij z uporabo robotskega sistema, ki so ga namestili konec lanskega leta. "Pričakuje se, da bodo ti modeli lahko odkrili novo znanost," pravi Gomes.

  1. Gray, A. Prednatis na arXiv https://doi.org/10.48550/arXiv.2403.16887 (2024).

  2. Kobak, D., González-Márquez, R., Horvát, E.-Á. & Lause, J. Prednatis na arXiv https://doi.org/10.48550/arXiv.2406.07016 (2024).

  3. Liang, W. et al. Prednatis na arXiv https://doi.org/10.48550/arXiv.2404.01268 (2024).

  4. Liang, W. et al. Prednatis na arXiv https://doi.org/10.48550/arXiv.2403.07183 (2024).

  5. Weber-Wulff, D. et al. Int. J. Educ. Integr. 19, 26 (2023).

    člen
    PubMed

    Google Učenjak

  6. Liang, Y., Yang, T. & Zhu, F. Prednatis na SSRN https://doi.org/10.2139/ssrn.4992755 (2024).

  7. Farquhar, S. et al. Narava 630, 625–630 (2024).

    člen
    PubMed

    Google Učenjak

  8. Swanson, K., Wu, W., Bulaong, N. L., Pak, J. E. & Zou, J. Prednatis na bioRxiv https://doi.org/10.1101/2024.11.11.623004 (2024).

Prenesite reference