Τα μοντέλα γλώσσας τεχνητής νοημοσύνης θα μπορούσαν να είναι προσβλητικά ή μεροληπτικά προς τα άτομα με ειδικές ανάγκες

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Η Επεξεργασία Φυσικής Γλώσσας (NLP) είναι ένας τύπος τεχνητής νοημοσύνης που επιτρέπει στις μηχανές να χρησιμοποιούν κείμενο και προφορικές λέξεις σε πολλές διαφορετικές εφαρμογές - όπως έξυπνοι βοηθοί ή φίλτρα αυτόματης διόρθωσης email και ανεπιθύμητων μηνυμάτων - Βοηθήστε στην αυτοματοποίηση και τη βελτιστοποίηση διαδικασιών για μεμονωμένους χρήστες και εταιρείες. Ωστόσο, σύμφωνα με ερευνητές στο Penn State College of Information Sciences and Technology (IST), οι αλγόριθμοι που τροφοδοτούν αυτήν την τεχνολογία συχνά εμφανίζουν προκαταλήψεις που θα μπορούσαν να είναι προσβλητικές ή προκατειλημμένες προς τα άτομα με αναπηρία. Οι ερευνητές διαπίστωσαν ότι όλοι οι αλγόριθμοι και τα μοντέλα που δοκίμασαν περιείχαν σημαντική έμμεση προκατάληψη έναντι των ατόμων με αναπηρία. Προηγούμενος…

Natural Language Processing (NLP) ist eine Art künstliche Intelligenz, die es Maschinen ermöglicht, Text und gesprochene Wörter in vielen verschiedenen Anwendungen zu verwenden -; wie intelligente Assistenten oder E-Mail-Autokorrektur und Spamfilter -; Unterstützung bei der Automatisierung und Optimierung von Abläufen für einzelne Benutzer und Unternehmen. Laut Forschern des Penn State College of Information Sciences and Technology (IST) weisen die Algorithmen, die diese Technologie antreiben, jedoch häufig Tendenzen auf, die Menschen mit Behinderungen gegenüber beleidigend oder voreingenommen sein könnten. Die Forscher fanden heraus, dass alle von ihnen getesteten Algorithmen und Modelle eine signifikante implizite Voreingenommenheit gegenüber Menschen mit Behinderungen enthielten. Frühere …
Η Επεξεργασία Φυσικής Γλώσσας (NLP) είναι ένας τύπος τεχνητής νοημοσύνης που επιτρέπει στις μηχανές να χρησιμοποιούν κείμενο και προφορικές λέξεις σε πολλές διαφορετικές εφαρμογές - όπως έξυπνοι βοηθοί ή φίλτρα αυτόματης διόρθωσης email και ανεπιθύμητων μηνυμάτων - Βοηθήστε στην αυτοματοποίηση και τη βελτιστοποίηση διαδικασιών για μεμονωμένους χρήστες και εταιρείες. Ωστόσο, σύμφωνα με ερευνητές στο Penn State College of Information Sciences and Technology (IST), οι αλγόριθμοι που τροφοδοτούν αυτήν την τεχνολογία συχνά εμφανίζουν προκαταλήψεις που θα μπορούσαν να είναι προσβλητικές ή προκατειλημμένες προς τα άτομα με αναπηρία. Οι ερευνητές διαπίστωσαν ότι όλοι οι αλγόριθμοι και τα μοντέλα που δοκίμασαν περιείχαν σημαντική έμμεση προκατάληψη έναντι των ατόμων με αναπηρία. Προηγούμενος…

Τα μοντέλα γλώσσας τεχνητής νοημοσύνης θα μπορούσαν να είναι προσβλητικά ή μεροληπτικά προς τα άτομα με ειδικές ανάγκες

Η Επεξεργασία Φυσικής Γλώσσας (NLP) είναι ένας τύπος τεχνητής νοημοσύνης που επιτρέπει στις μηχανές να χρησιμοποιούν κείμενο και προφορικές λέξεις σε πολλές διαφορετικές εφαρμογές - όπως έξυπνοι βοηθοί ή φίλτρα αυτόματης διόρθωσης email και ανεπιθύμητων μηνυμάτων - Βοηθήστε στην αυτοματοποίηση και τη βελτιστοποίηση διαδικασιών για μεμονωμένους χρήστες και εταιρείες. Ωστόσο, σύμφωνα με ερευνητές στο Penn State College of Information Sciences and Technology (IST), οι αλγόριθμοι που τροφοδοτούν αυτήν την τεχνολογία συχνά εμφανίζουν προκαταλήψεις που θα μπορούσαν να είναι προσβλητικές ή προκατειλημμένες προς τα άτομα με αναπηρία.

Οι ερευνητές διαπίστωσαν ότι όλοι οι αλγόριθμοι και τα μοντέλα που δοκίμασαν περιείχαν σημαντική έμμεση προκατάληψη έναντι των ατόμων με αναπηρία. Προηγούμενη έρευνα για προεκπαιδευμένα γλωσσικά μοντέλα -; τα οποία εκπαιδεύονται σε μεγάλες ποσότητες δεδομένων που μπορεί να περιέχουν σιωπηρές προκαταλήψεις - έχει εντοπίσει κοινωνικοδημογραφικές προκαταλήψεις ως προς το φύλο και τη φυλή, αλλά μέχρι τώρα παρόμοιες προκαταλήψεις προς τα άτομα με αναπηρίες δεν έχουν μελετηθεί ευρέως.

«Τα 13 μοντέλα που εξετάσαμε είναι ευρέως χρησιμοποιούμενα και έχουν δημόσιο χαρακτήρα», δήλωσε σήμερα (13 Οκτωβρίου) ο Pranav Venkit, μεταπτυχιακός φοιτητής στο College of IST και πρώτος συγγραφέας της μελέτης, στο 29ο Διεθνές Συνέδριο Υπολογιστικής Γλωσσολογίας (COLING). «Ελπίζουμε τα ευρήματά μας να βοηθήσουν τους προγραμματιστές που αναπτύσσουν τεχνητή νοημοσύνη για να βοηθήσουν συγκεκριμένες ομάδες –ιδιαίτερα άτομα με αναπηρίες που βασίζονται στην τεχνητή νοημοσύνη στις καθημερινές τους δραστηριότητες– να γνωρίζουν αυτές τις προκαταλήψεις».

Στη μελέτη τους, οι ερευνητές εξέτασαν μοντέλα μηχανικής μάθησης εκπαιδευμένα σε δεδομένα πηγής για να ομαδοποιήσουν παρόμοιες λέξεις μαζί, επιτρέποντας σε έναν υπολογιστή να δημιουργεί αυτόματα ακολουθίες λέξεων. Δημιούργησαν τέσσερα απλά πρότυπα προτάσεων στα οποία ένα ουσιαστικό γένους "man", "woman" ή "person" και ένα από τα 10 πιο συχνά χρησιμοποιούμενα επίθετα στην αγγλική γλώσσα μπορεί να συμπληρωθεί μεταβλητά -? για παράδειγμα: «Είστε οι γονείς ενός καλού ανθρώπου». Στη συνέχεια δημιούργησαν περισσότερα από 600 επίθετα που θα μπορούσαν να συσχετιστούν είτε με άτομα με ή χωρίς αναπηρία -? όπως νευροτυπικά ή με προβλήματα όρασης -? για να αντικαταστήσετε τυχαία το επίθετο σε κάθε πρόταση. Η ομάδα εξέτασε περισσότερες από 15.000 μοναδικές προτάσεις σε κάθε μοντέλο για να δημιουργήσει συσχετίσεις λέξεων για τα επίθετα.

Για παράδειγμα, επιλέξαμε τη λέξη «καλή» και θέλαμε να δούμε πώς συνδέεται με όρους που αναφέρονται τόσο σε μη αναπηρία όσο και σε αναπηρία. Με την προσθήκη ενός όρου μη αναπηρίας, το αποτέλεσμα μεταβαίνει από "καλό" σε "εξαιρετικό". Αλλά όταν το «καλό» συνδέεται με έναν όρο αναπηρίας, παίρνουμε το αποτέλεσμα «κακό». Έτσι, αυτή η αλλαγή στη μορφή του ίδιου του επιθέτου δείχνει τη ρητή προκατάληψη του μοντέλου».

Pranav Venkit, υποψήφιος διδάκτορας, College of IST

Ενώ αυτή η άσκηση αποκάλυψε τη ρητή μεροληψία που υπάρχει στα μοντέλα, οι ερευνητές ήθελαν να εξετάσουν περαιτέρω κάθε μοντέλο για σιωπηρή μεροληψία -. Στάσεις απέναντι στους ανθρώπους ή συσχέτιση στερεοτύπων μαζί τους χωρίς συνειδητή γνώση. Εξέτασαν τα επίθετα που δημιουργήθηκαν για ομάδες ατόμων με αναπηρία και μη και μέτρησαν τη διάθεση κάθε ατόμου -? μια τεχνική NLP για την αξιολόγηση του εάν το κείμενο είναι θετικό, αρνητικό ή ουδέτερο. Όλα τα μοντέλα που εξέτασαν βαθμολόγησαν με συνέπεια τις προτάσεις με λέξεις που σχετίζονται με την αναπηρία πιο αρνητικά από εκείνα χωρίς. Ένα συγκεκριμένο μοντέλο προεκπαιδευμένο σε δεδομένα Twitter μετέτρεψε τη βαθμολογία του συναισθήματος από θετική σε αρνητική 86% των φορών που χρησιμοποιήθηκε ένας όρος που σχετίζεται με την αναπηρία.

"Αν κοιτάξουμε απλώς αυτήν την τιμή, θα δούμε ότι προσθέτοντας έναν όρο που σχετίζεται με την αναπηρία στη συνομιλία, η συναισθηματική αξία ολόκληρης της πρότασης μειώνεται", είπε ο Venkit. «Για παράδειγμα, εάν ένας χρήστης συμπεριλάβει έναν όρο που σχετίζεται με την αναπηρία σε ένα σχόλιο ή μια ανάρτηση στα μέσα κοινωνικής δικτύωσης, η πιθανότητα αυτή η ανάρτηση να λογοκριθεί ή να περιοριστεί αυξάνεται».

Οι ερευνητές δοκίμασαν επίσης για σιωπηρή μεροληψία σε δύο μεγάλα γλωσσικά μοντέλα που χρησιμοποιούνται για την αυτόματη δημιουργία μεγάλων κειμένων, όπως άρθρα ειδήσεων, για να δουν πώς θα άλλαζε ένα διάστημα στο πρότυπο πρότασης ανάλογα με το επίθετο που χρησιμοποιείται. Σε αυτή την ανάλυση, δημιούργησαν 7.500 προτάσεις, και πάλι με μεταβλητή εισαγωγή επίθετων που αναφέρονται σε μη αναπηρία ή αναπηρία και δοκίμασαν πώς θα άλλαζε ένα κενό στο πρότυπο πρότασης ανάλογα με το επίθετο που χρησιμοποιείται. Σε αυτήν την περίπτωση, όταν δίνεται η πρόταση "Ένας άντρας έχει "κενό", τα γλωσσικά μοντέλα προέβλεψαν "άλλαξε" για την κενή λέξη. Ωστόσο, όταν ένα επίθετο που σχετίζεται με την αναπηρία προστέθηκε στην πρόταση, με αποτέλεσμα "Ένας κωφός-τυφλός άνδρας έχει "άδειο", το μοντέλο προέβλεψε "πέθανε" για το κενό.

Η σιωπηρή μεροληψία των μοντέλων έναντι των ατόμων με αναπηρία θα μπορούσε να είναι εμφανής σε διάφορες εφαρμογές -. για παράδειγμα, στα μηνύματα κειμένου, όταν εφαρμόζεται αυτόματη διόρθωση σε μια ανορθόγραφη λέξη ή στα μέσα κοινωνικής δικτύωσης, όπου υπάρχουν κανόνες που απαγορεύουν τις υβριστικές ή ενοχλητικές αναρτήσεις. Δεδομένου ότι οι άνθρωποι δεν μπορούν να ελέγξουν τον μεγάλο αριθμό αναρτήσεων, τα μοντέλα τεχνητής νοημοσύνης χρησιμοποιούν αυτές τις βαθμολογίες συναισθήματος για να φιλτράρουν εκείνες τις αναρτήσεις που θεωρείται ότι παραβιάζουν τα κοινοτικά πρότυπα της πλατφόρμας.

«Εάν κάποιος μιλάει για αναπηρία και η ανάρτηση δεν είναι τοξική, ένα μοντέλο σαν αυτό που δεν εστιάζει στον διαχωρισμό των προκαταλήψεων θα μπορούσε να κατηγοριοποιήσει την ανάρτηση ως τοξική μόνο και μόνο επειδή υπάρχει μια αναπηρία που σχετίζεται με την ανάρτηση», εξήγησε ο Mukund Srinath. Διδάκτωρ στο College of IST και συν-συγγραφέας της μελέτης.

"Όποτε ένας ερευνητής ή προγραμματιστής χρησιμοποιεί ένα από αυτά τα μοντέλα, δεν κοιτάζει πάντα όλα τα διαφορετικά είδη και τους ανθρώπους που θα επηρεαστούν από αυτό - ειδικά όταν επικεντρώνονται στα αποτελέσματα και την ποιότητα αυτού που προσφέρουν", είπε ο Venkit. «Αυτή η εργασία δείχνει ότι οι άνθρωποι πρέπει να είναι προσεκτικοί σχετικά με το είδος των μοντέλων που χρησιμοποιούν και τον αντίκτυπο που μπορεί να έχει σε πραγματικούς ανθρώπους στην καθημερινή τους ζωή».

Ο Venkit και ο Srinath συνεργάστηκαν με τον Shomir Wilson, επίκουρο καθηγητή επιστήμης και τεχνολογίας της πληροφορίας, στο έργο.

Πηγή:

Πενσυλβάνια

.