Τα παράδοξα των Πολάκη και Σίμσον

Aναδημοσίευση από το https://commune.org.gr

του Γιώργου Γαλανή

«Η μεγαλύτερη σας αποτυχία είναι ότι με βάση επίσημα στοιχεία του κ. Τσιόδρα που ανακοίνωσε ότι οι νεκροί από αρχή της πανδημίας που ήταν πλήρως εμβολιασμένοι ήταν 701! Στις 7/11 οι νεκροί είναι 1.047! Δηλαδή από τις 10/10 μέχρι τις 7/11 πέθαναν δυστυχώς 346 πλήρως εμβολιασμένοι! Πόσοι πέθαναν ακριβώς το ίδιο διάστημα συνολικά στη χώρα; 1.118! Τι ποσοστό είναι οι 346 στους 1.118; Αυτό είναι η επιτυχία σας;»

Παύλος Πολάκης

Με μία πρώτη ματιά φαίνεται από την στατιστική του γιατρού (και βουλευτή) Παύλου Πολάκη να μην έχει μεγάλο νόημα κάποιος να εμβολιάζεται, αφού αν και ένα μεγάλο ποσοστό του κόσμου έχει κάνει εμβόλια, παρ’ όλα αυτά αρρωσταίνει. Μπορούμε όμως να βγάλουμε αυτό το συμπέρασμα από τα παραπάνω νούμερα; Προκειμένου να  απαντήσουμε στην ερώτηση, ας δούμε ένα γνωστό παράδοξο της στατιστικής.

Ένας γιατρός, ο κύριος Σίμσον, διαβάζει σε ένα άρθρο για ένα καινούριο φάρμακο (το φάρμακο Φ) το οποίο είναι φτιαγμένο με στόχο τη μείωση του ρίσκου εμφράγματος. Το άρθρο λέει ότι με βάση τις μελέτες το φάρμακο Φ φαίνεται να είναι γενικά αποτελεσματικό. Ενθουσιασμένος ο γιατρός, ψάχνει να βρει και να διαβάσει αναλυτικά τις στατιστικές που αφορούν σε δύο ομάδες: άνδρες και γυναίκες. Ο ενθουσιασμός του μετριάζεται όταν διαβάζει την πρώτη στατιστική με τρόπο τέτοιο που δείχνει ότι το ρίσκο για έμφραγμα στους άνδρες ασθενείς είναι μεγαλύτερο στην περίπτωση που έχουν πάρει το φάρμακο. Με μεγάλη του έκπληξη διαβάζει την επόμενη στατιστική που έχει αντίστοιχα αποτελέσματα για τις γυναίκες. Τα συνολικά αποτελέσματα που διαβάζει ο κύριος Σίμσον παρουσιάζονται παρακάτω:

Δεν πήραν φάρμακοΔεν πήραν φάρμακοΠήραν φάρμακοΠήραν φάρμακο
έμφραγμαΧωρίς έμφραγμαέμφραγμαΧωρίς έμφραγμα
γυναίκες119337
άνδρες1228812
σύνολο13471149

Όπως μπορούμε να παρατηρήσουμε στην πρώτη γραμμή του πίνακα, μία από τις 20 γυναίκες που δεν πήραν το φάρμακο έπαθαν έμφραγμα, δηλαδή το 5,0% από αυτές, ενώ από αυτές που το πήραν, δηλαδή 3 από τις 40  έπαθαν έμφραγμα, δηλαδή το 7,5% από αυτές. Επομένως, αυτές που πήραν το φάρμακο εμφάνισαν μεγαλύτερο ποσοστό εμφραγμάτων (7,5% έναντι 5,0%). Διαβάζοντας έτσι τους αριθμούς βρίσκουμε ότι το φάρμακο όχι μόνο δεν προστατεύει από το έμφραγμα, αλλά επιπλέον επιδεινώνει την κατάσταση.

Το ίδιο παρατηρούμε στους άνδρες: Ενώ 30% από αυτούς (12 στους 40) των ανδρών που δεν πήραν το φάρμακο έπαθαν έμφραγμα, μεταξύ αυτών που το πήραν έπαθαν έμφραγμα οι 8 από τους 20 δηλαδή το 40% (δεύτερη γραμμή του πίνακα). Επομένως, διαβάζοντας έτσι τους αριθμούς, βρίσκουμε και για τους άνδρες αυτό που βρήκαμε προηγουμένως για τις γυναίκες, δηλαδή ότι το φάρμακο όχι μόνο δεν προστατεύει από το έμφραγμα αλλά επιπλέον επιδεινώνει την κατάσταση.

Ας κάνουμε τώρα τον ίδιο υπολογισμό για το σύνολο των ανδρών και των γυναικών μαζί, που φαίνονται στην τρίτη γραμμή του πίνακα. Θα διαπιστώσουμε τότε ότι οι 13 στις 60 γυναίκες και άνδρες μαζί που δεν πήραν το φάρμακο, έπαθαν έμφραγμα, δηλαδή το 22% από αυτούς και αυτές που πήραν το φάρμακο, έπαθαν έμφραγμα οι 11 από τους 60 νόσησε δηλαδή περίπου 18%. Φτάνουμε δηλαδή στο ακριβώς αντίθετο συμπέρασμα από αυτό που φτάσαμε προηγουμένως, όταν κάναμε τους υπολογισμούς μας ξεχωριστά για τους άνδρες και τις γυναίκες!

Η παραπάνω ιστορία είναι μεν φανταστική[i] αλλά το στατιστικό παράδοξο το οποίο έχει ανακαλυφθεί το 1951 από τον Βρετανό στατιστικό Edward Simpson έχει παρατηρηθεί σε σειρά από πραγματικές περιπτώσεις. Ο λόγος που το παραπάνω παράδειγμα είναι ένα παράδοξο, σχετίζεται με το γεγονός ότι το συμπέρασμα στο οποίο φτάνουμε αναλύοντας τους δύο πληθυσμούς (ανδρών και γυναικών) ξεχωριστά, αντιστρέφεται όταν αναλύουμε το άθροισμα των δύο πληθυσμών. Η «αντιστροφή» αυτή σχετίζεται με το γεγονός ότι το άθροισμα δύο κλασμάτων δεν ισούται με ένα κλάσμα όπου ο αριθμητής είναι ίσος με το άθροισμα των αριθμητών και ο παρονομαστής ίσος με το άθροισμα των παρονομαστών.[ii]

Το παράδοξο του Σίμσον μας δείχνει ότι θα πρέπει να προσέχουμε ιδιαιτέρως όταν θέλουμε να συγκρίνουμε ανόμοια πράγματα (ή κλάσματα με διαφορετικούς παρονομαστές). Το παράδειγμα του Πολάκη είναι χαρακτηριστικό. Πως γίνεται τα εμβόλια να προστατεύουν από τη βαριά νόσο και την ίδια στιγμή το 1/3 περίπου των θανάτων να είναι εμβολιασμένα άτομα; Η απάντηση και εδώ είναι στον παρονομαστή: είναι μεγαλύτερο το ποσοστό που έχει εμβολιαστεί και άρα τα εμβόλια είναι πολύ πιο αποτελεσματικά από αυτό που υπονοεί ο Πολάκης. Με σταθερό το ποσοστό νεκρών από την κατηγορία των εμβολιασμένων, όσο ανεβαίνει το ποσοστό των εμβολιασμένων στο σύνολο του πληθυσμού, τόσο θα αυξάνεται ο αριθμός των εμβολιασμένων που πεθαίνει αλλά την ίδια στιγμή θα μειώνεται ο αριθμός των νέων νεκρών από κορονοιό συνολικά. Αυτός ο λόγος αρκεί για την άμεση εφαρμογή καθολικού εμβολισαμού.

[i] Το παράδειγμα είναι δανεισμένο από το The Book of Why: The New Science of Cause and Effect των Judea Pearl και Dana MacKenzie εκδόσεις Penguin, 2019.

[ii] Πχ. 1/2 + 1/2 =1 και όχι  2/4 που είναι ίσο με 1/2.