Τεχνητή Νοημοσύνη και καρκίνος: Γιατί η σωστή εκπαίδευση των αλγορίθμων είναι κρίσιμη για τη διάγνωση σε ομάδες χαμηλότερου κινδύνου

 Τεχνητή Νοημοσύνη και καρκίνος: Γιατί η σωστή εκπαίδευση των αλγορίθμων είναι κρίσιμη για τη διάγνωση σε ομάδες χαμηλότερου κινδύνου

Νέες μελέτες αποκαλύπτουν πώς η μεροληψία στην εκπαίδευση της AI μπορεί να επηρεάσει την ακρίβεια της ιατρικής διάγνωσης.

Η Τεχνητή Νοημοσύνη (AI) εξελίσσεται ραγδαία σε πολύτιμο εργαλείο για την ανίχνευση και τη διάγνωση του καρκίνου. Ωστόσο, πρόσφατα επιστημονικά δεδομένα δείχνουν ότι η αποτελεσματικότητά της δεν είναι ίδια για όλους τους ασθενείς, ιδιαίτερα όταν οι αλγόριθμοι δεν έχουν εκπαιδευτεί με τον σωστό και «λεπτομερή» τρόπο.

Δύο πρόσφατες μελέτες υπογραμμίζουν ότι τα εργαλεία AI μπορεί να εμφανίζουν χαμηλότερη διαγνωστική ακρίβεια σε ορισμένες πληθυσμιακές ομάδες, ακόμη και όταν τα δεδομένα εκπαίδευσης είναι αριθμητικά ισοδύναμα μεταξύ διαφορετικών δημογραφικών ομάδων.

Η γνωστή πρόκληση της άνισης διαχείρισης δεδομένων

Είναι ήδη ευρέως γνωστό ότι όταν τα συστήματα Τεχνητής Νοημοσύνης εκπαιδεύονται σε δεδομένα που προέρχονται δυσανάλογα από συγκεκριμένες δημογραφικές ομάδες, δυσκολεύονται να αποδώσουν με ακρίβεια σε ομάδες που δεν εκπροσωπούνται επαρκώς. Αυτό έχει ως αποτέλεσμα αυξημένα ποσοστά λανθασμένων διαγνώσεων σε μειονοτικές ή λιγότερο μελετημένες πληθυσμιακές ομάδες.

Ωστόσο, σύμφωνα με νέα ανάλυση που δημοσιεύθηκε στο επιστημονικό περιοδικό Cell Reports Medicine, το πρόβλημα δεν περιορίζεται μόνο στην ποσότητα των δεδομένων.

Όταν η AI αποδίδει χειρότερα, ακόμη και με ίσα δείγματα

Οι ερευνητές διαπίστωσαν ότι τα μοντέλα Τεχνητής Νοημοσύνης παρουσίαζαν χειρότερη απόδοση σε ορισμένες δημογραφικές ομάδες ακόμη και όταν τα μεγέθη των δειγμάτων ήταν συγκρίσιμα. Η εξήγηση φαίνεται να σχετίζεται με τη διαφορετική συχνότητα εμφάνισης ορισμένων τύπων καρκίνου σε συγκεκριμένες ομάδες πληθυσμού.

Όταν ένας τύπος καρκίνου είναι πιο συχνός σε μια ομάδα, τα μοντέλα AI «μαθαίνουν» καλύτερα να τον αναγνωρίζουν σε αυτήν. Αντίθετα, δυσκολεύονται να διαγνώσουν την ίδια νόσο σε πληθυσμούς όπου εμφανίζεται σπανιότερα, γεγονός που μειώνει τη συνολική τους ακρίβεια.

Μοριακές διαφορές που μπερδεύουν τους αλγορίθμους

Ένα ακόμη κρίσιμο εύρημα αφορά τις λεπτές μοριακές διαφορές που μπορεί να υπάρχουν στα δείγματα βιοψίας μεταξύ διαφορετικών δημογραφικών ομάδων. Οι αλγόριθμοι AI ενδέχεται να ανιχνεύουν αυτές τις διαφορές και να τις χρησιμοποιούν, έμμεσα, ως «δείκτες» τύπου καρκίνου.

Αυτό σημαίνει ότι η Τεχνητή Νοημοσύνη μπορεί να βασίζεται σε μοριακά χαρακτηριστικά που σχετίζονται περισσότερο με τη δημογραφική προέλευση του ασθενούς παρά με την ίδια τη νόσο, καθιστώντας τη διάγνωση λιγότερο αξιόπιστη σε πληθυσμούς όπου αυτές οι μεταλλάξεις είναι σπανιότερες.

Η δύναμη και ο κίνδυνος της υπερευαισθησίας της AI

Όπως δήλωσε ο επικεφαλής της μελέτης, καθηγητής Kun-Hsing Yu της Ιατρικής Σχολής του Χάρβαρντ: «Διαπιστώσαμε ότι, επειδή η Τεχνητή Νοημοσύνη είναι τόσο ισχυρή, μπορεί να διακρίνει πολύ λεπτά βιολογικά σήματα που δεν είναι ανιχνεύσιμα με τη συμβατική ανθρώπινη αξιολόγηση».

Αυτό, όμως, έχει και την αρνητική του πλευρά: τα μοντέλα μπορεί να εντοπίζουν σήματα που σχετίζονται περισσότερο με δημογραφικά χαρακτηριστικά παρά με την ίδια την ασθένεια. Η εξαγωγή τέτοιων πληροφοριών από παθολογοανατομικές εικόνες μπορεί να επηρεάσει τη διαγνωστική ικανότητα της AI μεταξύ διαφορετικών πληθυσμών.

Η μεροληψία δεν είναι μόνο θέμα δεδομένων

Σύμφωνα με τους ερευνητές, η μεροληψία στα συστήματα παθολογοανατομικής AI δεν οφείλεται αποκλειστικά στην ποιότητα ή την αντιπροσωπευτικότητα των δεδομένων εκπαίδευσης. Εξίσου σημαντικό ρόλο παίζει και ο τρόπος με τον οποίο εκπαιδεύονται οι αλγόριθμοι.

Όταν η ερευνητική ομάδα εφάρμοσε ένα νέο εκπαιδευτικό πλαίσιο στα μοντέλα που είχε αναπτύξει, οι διαγνωστικές ανισότητες μειώθηκαν κατά περίπου 88%, ένα ιδιαίτερα ενθαρρυντικό αποτέλεσμα.

Πιο δίκαιη και γενικεύσιμη Τεχνητή Νοημοσύνη στην Υγεία

«Δείχνουμε ότι με μια σχετικά μικρή προσαρμογή, τα μοντέλα μπορούν να μάθουν πιο ανθεκτικά χαρακτηριστικά, καθιστώντας τα πιο γενικεύσιμα και πιο δίκαια για διαφορετικούς πληθυσμούς», σημείωσε ο καθηγητής Yu.

Το εύρημα είναι ιδιαίτερα αισιόδοξο, καθώς υποδηλώνει ότι η μεροληψία μπορεί να μειωθεί ακόμη και χωρίς απολύτως ισόρροπα και πλήρως αντιπροσωπευτικά δεδομένα εκπαίδευσης.

Η πρόκληση της μεροληψίας και πέρα από τον καρκίνο

Σε ξεχωριστή μελέτη που δημοσιεύθηκε στο PLOS Biology, ερευνητές διαπίστωσαν ότι ακόμη και όταν χρησιμοποιούνται ευρεία δείγματα βακτηριακών πληθυσμών, η μεροληψία μπορεί να περιορίζει τις δυνατότητες της Τεχνητής Νοημοσύνης στην πρόβλεψη και την αντιμετώπιση της αντοχής στα αντιβιοτικά.

Το μήνυμα είναι σαφές: η AI στην Υγεία έχει τεράστιες δυνατότητες, αλλά η υπεύθυνη και προσεκτική εκπαίδευσή της αποτελεί προϋπόθεση για αξιόπιστες, δίκαιες και πραγματικά ωφέλιμες εφαρμογές για όλους τους ασθενείς.