Τα μοντέλα παθολογικής τεχνητής νοημοσύνης αποκαλύπτουν δημογραφικές προκαταλήψεις στη διάγνωση του καρκίνου
Η παθολογία είναι από καιρό ο ακρογωνιαίος λίθος της διάγνωσης και της θεραπείας του καρκίνου. Ένας παθολόγος εξετάζει προσεκτικά ένα εξαιρετικά λεπτό τμήμα ανθρώπινου ιστού κάτω από ένα μικροσκόπιο για ενδείξεις που υποδεικνύουν την παρουσία, τον τύπο και το στάδιο του καρκίνου. Για έναν άνθρωπο ειδικό, η εξέταση ενός στροβιλιζόμενου δείγματος ροζ ιστού με διάστικτα μωβ κύτταρα είναι...
Τα μοντέλα παθολογικής τεχνητής νοημοσύνης αποκαλύπτουν δημογραφικές προκαταλήψεις στη διάγνωση του καρκίνου
Η παθολογία είναι από καιρό ο ακρογωνιαίος λίθος της διάγνωσης και της θεραπείας του καρκίνου. Ένας παθολόγος εξετάζει προσεκτικά ένα εξαιρετικά λεπτό τμήμα ανθρώπινου ιστού κάτω από ένα μικροσκόπιο για ενδείξεις που υποδεικνύουν την παρουσία, τον τύπο και το στάδιο του καρκίνου.
Για έναν άνθρωπο ειδικό, η εξέταση ενός στροβιλιζόμενου δείγματος ροζ ιστού με διάστικτα μωβ κύτταρα είναι σαν να βαθμολογεί μια εξέταση χωρίς όνομα - η διαφάνεια αποκαλύπτει βασικές πληροφορίες για την ασθένεια χωρίς να παρέχει περισσότερες λεπτομέρειες για τον ασθενή.
Ωστόσο, δεν ισχύει απαραίτητα το ίδιο για τα μοντέλα τεχνητής νοημοσύνης στην παθολογία που έχουν εμφανιστεί τα τελευταία χρόνια. Μια νέα μελέτη με επικεφαλής μια ομάδα της Ιατρικής Σχολής του Χάρβαρντ δείχνει ότι αυτά τα μοντέλα μπορούν με κάποιο τρόπο να συνάγουν δημογραφικές πληροφορίες από διαφάνειες παθολογίας, οδηγώντας σε προκατάληψη διάγνωσης καρκίνου σε διαφορετικούς πληθυσμούς.
Αναλύοντας πολλά βασικά μοντέλα τεχνητής νοημοσύνης παθολογίας για τη διάγνωση του καρκίνου, οι ερευνητές βρήκαν άνιση απόδοση στην ανίχνευση και τη διαφοροποίηση καρκίνων σε διαφορετικούς πληθυσμούς με βάση το φύλο, τη φυλή και την ηλικία των ασθενών. Προσδιόρισαν πολλές πιθανές εξηγήσεις για αυτή τη δημογραφική προκατάληψη.
Στη συνέχεια, η ομάδα ανέπτυξε ένα πλαίσιο που ονομάζεται FAIR-Path, το οποίο βοήθησε στη μείωση της προκατάληψης στα μοντέλα.
Η ανάγνωση δημογραφικών δεδομένων από μια διαφάνεια παθολογίας θεωρείται «αδύνατη αποστολή» για έναν άνθρωπο παθολόγο, επομένως η προκατάληψη στην παθολογική τεχνητή νοημοσύνη ήταν μια έκπληξη για εμάς».
Kun-Hsing Yu, ανώτερος συγγραφέας, αναπληρωτής καθηγητής βιοϊατρικής πληροφορικής, Blavatnik Institute στο HMS και HMS επίκουρος καθηγητής παθολογίας στο Brigham and Women's Hospital
Η ανίχνευση και η καταπολέμηση της προκατάληψης της τεχνητής νοημοσύνης στην ιατρική είναι κρίσιμη επειδή μπορεί να επηρεάσει τη διαγνωστική ακρίβεια καθώς και τα αποτελέσματα των ασθενών, είπε ο Yu. Η επιτυχία του FAIR-Path δείχνει ότι οι ερευνητές μπορούν να βελτιώσουν τη δικαιοσύνη των μοντέλων τεχνητής νοημοσύνης για την παθολογία του καρκίνου, και ενδεχομένως άλλων μοντέλων τεχνητής νοημοσύνης στην ιατρική, με ελάχιστη προσπάθεια.
Το έργο, που υποστηρίζεται εν μέρει από ομοσπονδιακή χρηματοδότηση, περιγράφεται στις 16 ΔεκεμβρίουCell Reports Medicine.
Ελέγξτε για προκατάληψη
Ο Yu και η ομάδα του εξέτασαν την προκατάληψη σε τέσσερα τυπικά μοντέλα παθολογίας AI που αναπτύχθηκαν για την αξιολόγηση του καρκίνου. Αυτά τα μοντέλα βαθιάς μάθησης εκπαιδεύτηκαν σε σύνολα σχολιασμένων διαφανειών παθολογίας, από τα οποία «μάθαιναν» βιολογικά μοτίβα που τους επιτρέπουν να αναλύουν νέες διαφάνειες και να κάνουν διαγνώσεις.
Οι ερευνητές τροφοδότησαν τα μοντέλα AI με ένα μεγάλο, διαθεσμικό αρχείο διαφανειών παθολογίας από 20 τύπους καρκίνου.
Διαπίστωσαν ότι και τα τέσσερα μοντέλα είχαν στρεβλή απόδοση και παρείχαν λιγότερο ακριβείς διαγνώσεις για ασθενείς σε ορισμένες ομάδες με βάση τη φυλή, το φύλο και την ηλικία που αναφέρονταν από τους ίδιους. Για παράδειγμα, τα μοντέλα είχαν δυσκολία να διακρίνουν τους υποτύπους καρκίνου του πνεύμονα σε αφροαμερικανούς και άνδρες ασθενείς και τους υποτύπους καρκίνου του μαστού σε νεότερους ασθενείς. Τα μοντέλα δυσκολεύτηκαν επίσης να ανιχνεύσουν καρκίνους του μαστού, των νεφρών, του θυρεοειδούς και του στομάχου σε ορισμένους πληθυσμούς. Αυτές οι διαφορές απόδοσης εμφανίστηκαν στο 29% περίπου των διαγνωστικών εργασιών που εκτελούσαν τα μοντέλα.
Αυτή η διαγνωστική ανακρίβεια, είπε ο Yu, οφείλεται στο ότι αυτά τα μοντέλα εξάγουν δημογραφικές πληροφορίες από τις διαφάνειες - και βασίζονται σε συγκεκριμένα δημογραφικά μοτίβα για τη διάγνωση.
Τα αποτελέσματα ήταν απροσδόκητα «γιατί θα περιμέναμε μια αντικειμενική αξιολόγηση της παθολογίας», πρόσθεσε ο Yu. «Όταν αξιολογούμε εικόνες, δεν χρειάζεται απαραίτητα να γνωρίζουμε τα δημογραφικά στοιχεία ενός ασθενούς για να κάνουμε μια διάγνωση».
Η ομάδα αναρωτήθηκε: Γιατί η παθολογική τεχνητή νοημοσύνη δεν έδειξε την ίδια αντικειμενικότητα;
Ψάχνοντας για εξηγήσεις
Οι ερευνητές κατέληξαν σε τρεις εξηγήσεις.
Επειδή είναι ευκολότερο για ασθενείς σε ορισμένους πληθυσμούς να λαμβάνουν δείγματα, τα μοντέλα AI εκπαιδεύονται σε άνισα μεγέθη δειγμάτων. Αυτό καθιστά πιο δύσκολο για τα μοντέλα να κάνουν ακριβή διάγνωση σε δείγματα που δεν αντιπροσωπεύονται καλά στο σετ εκπαίδευσης, όπως αυτά από μειονοτικές ομάδες με βάση τη φυλή, την ηλικία ή το φύλο.
Αλλά «το πρόβλημα ήταν πολύ βαθύτερο», είπε ο Yu. Οι ερευνητές παρατήρησαν ότι τα μοντέλα μερικές φορές είχαν χειρότερη απόδοση σε μια ομάδα πληθυσμού, ακόμη και όταν τα μεγέθη του δείγματος ήταν συγκρίσιμα.
Πρόσθετη ανάλυση διαπίστωσε ότι αυτό μπορεί να οφείλεται σε διαφορές στον επιπολασμό της νόσου: ορισμένοι καρκίνοι είναι πιο συχνοί σε ορισμένες ομάδες, γεγονός που καθιστά τα μοντέλα καλύτερα στη διάγνωση σε αυτές τις ομάδες. Ως αποτέλεσμα, τα μοντέλα μπορεί να έχουν δυσκολία στη διάγνωση καρκίνων σε πληθυσμούς όπου δεν είναι τόσο συνηθισμένοι.
Τα μοντέλα AI καταγράφουν επίσης ανεπαίσθητες μοριακές διαφορές σε δείγματα από διαφορετικές δημογραφικές ομάδες. Για παράδειγμα, τα μοντέλα μπορούν να ανιχνεύσουν μεταλλάξεις σε γονίδια-οδηγούς καρκίνου και να τις χρησιμοποιήσουν ως υποκατάστατο για τον τύπο του καρκίνου - και επομένως είναι λιγότερο αποτελεσματικά στη διάγνωση σε πληθυσμούς όπου αυτές οι μεταλλάξεις είναι λιγότερο συχνές.
«Διαπιστώσαμε ότι η ισχύς του AI του επιτρέπει να διακρίνει πολλά ασαφή βιολογικά σήματα που δεν μπορούν να ανιχνευθούν από την κανονική ανθρώπινη ερμηνεία», είπε ο Yu.
Αυτό επιτρέπει στα μοντέλα να μαθαίνουν πιθανά σήματα που σχετίζονται περισσότερο με δημογραφικά στοιχεία παρά με ασθένεια. Αυτό, με τη σειρά του, θα μπορούσε να επηρεάσει τις διαγνωστικές τους ικανότητες σε όλες τις ομάδες.
Συνολικά, λέει ο Yu, αυτές οι εξηγήσεις υποδηλώνουν ότι η προκατάληψη στην παθολογική τεχνητή νοημοσύνη δεν προέρχεται μόνο από τη μεταβλητή ποιότητα των δεδομένων εκπαίδευσης, αλλά και από τον τρόπο με τον οποίο οι ερευνητές εκπαιδεύουν τα μοντέλα.
Βρείτε μια λύση
Αφού αξιολόγησαν την έκταση και τα αίτια της μεροληψίας, ο Yu και η ομάδα του ξεκίνησαν να διορθώσουν το πρόβλημα.
Οι ερευνητές ανέπτυξαν το FAIR-Path, ένα απλό πλαίσιο που βασίζεται σε μια υπάρχουσα έννοια μηχανικής μάθησης που ονομάζεται αντιθετική μάθηση. Η αντιθετική μάθηση προσθέτει ένα στοιχείο στην εκπαίδευση τεχνητής νοημοσύνης που διδάσκει στο μοντέλο να δίνει έμφαση στις διαφορές μεταξύ σημαντικών κατηγοριών - στην περίπτωση αυτή των καρκίνων - και να υποβαθμίζει τις διαφορές μεταξύ λιγότερο σημαντικών κατηγοριών - σε αυτήν την περίπτωση δημογραφικών ομάδων.
Όταν οι ερευνητές εφάρμοσαν το πλαίσιο FAIR-Path στα μοντέλα που δοκίμασαν, μείωσε τις διαγνωστικές διαφορές κατά περίπου 88 τοις εκατό.
«Δείχνουμε ότι μέσω αυτής της μικρής προσαρμογής, τα μοντέλα μπορούν να μάθουν ισχυρά χαρακτηριστικά που τα καθιστούν πιο γενικεύσιμα και δίκαια σε διαφορετικούς πληθυσμούς», είπε ο Yu.
Το αποτέλεσμα είναι ενθαρρυντικό, πρόσθεσε, γιατί υποδηλώνει ότι οι προκαταλήψεις μπορούν να μειωθούν ακόμη και χωρίς εκπαίδευση των μοντέλων σε απολύτως δίκαια, αντιπροσωπευτικά δεδομένα.
Στη συνέχεια, ο Yu και η ομάδα του συνεργάζονται με ιδρύματα σε όλο τον κόσμο για να εξετάσουν την έκταση της μεροληψίας στην παθολογική τεχνητή νοημοσύνη σε τοποθεσίες με διαφορετικά δημογραφικά στοιχεία και διαφορετικές κλινικές και παθολογικές πρακτικές. Διερευνούν επίσης τρόπους για να επεκτείνουν το FAIR-Path σε ρυθμίσεις με περιορισμένα μεγέθη δειγμάτων. Επιπλέον, θέλουν να εξετάσουν πώς η μεροληψία στην τεχνητή νοημοσύνη συμβάλλει στις δημογραφικές αποκλίσεις στην υγειονομική περίθαλψη και στα αποτελέσματα των ασθενών.
Τελικά, είπε ο Yu, ο στόχος είναι να δημιουργηθούν δίκαια, αμερόληπτα παθολογικά μοντέλα τεχνητής νοημοσύνης που μπορούν να βελτιώσουν τη θεραπεία του καρκίνου βοηθώντας τους ανθρώπινους παθολόγους να κάνουν μια διάγνωση γρήγορα και με ακρίβεια.
«Νομίζω ότι υπάρχει ελπίδα ότι εάν είμαστε πιο συνειδητοί και προσεκτικοί στην ανάπτυξη συστημάτων AI, μπορούμε να αναπτύξουμε μοντέλα που λειτουργούν καλά σε οποιονδήποτε πληθυσμό», είπε.
Πηγές:
Lin, S.-Y.,et al. (2025). Η αντιθετική μάθηση ενισχύει τη δικαιοσύνη στα παθολογικά συστήματα τεχνητής νοημοσύνης. Cell Reports Medicine. doi:10.1016/j.xcrm.2025.102527. https://www.cell.com/cell-reports-medicine/fulltext/S2666-3791(25)00600-7