אחד האתגרים הגדולים בעולם היום, הוא להבין מה עושות מדינות שהצליחו להשתלט על המגיפה.
אנחנו חיים בעידן של דאטה זמין ושקוף (עד כמה שניתן) של היקפי הנדבקים, המחלימים והנפטרים – בכל מדינה.
וכאשר ישנו דאטה כזה, האתגר הופך מזמינות ליכולת הבנה מה המשמעות העמוקה שלו.
ועדיין, למרות כל העדכונים השוטפים, כמות הפרשנויות, הדעות, התיאוריות והביקורות – היא עצומה.
מרוב ריבוי הפרשנויות לדאטה, האדם הפשוט כבר לא יודע למי להאמין – לשלטונות, שמנסים להציל חיים, או לפרשנים אלטרנטיביים – לפעמים שאומרים את ההיפך הגמור.
המסקנה הברורה היא, שגם בעידן שיש בו כ"כ הרבה דאטה זמין, עדיין ללא הפרשנות המדויקת והמתאימה לסיטואציה – אפשר יהיה להסיק מסקנות שגויות לחלוטין.
זה קורה כי נתונים הם לא דבר סטרילי – יש בהם הרבה רעשים, הנחות עבודה והטיות.
ובמקרה של התפשטות הקורונה – התוצאה של פרשנות לא מקצועית עשויה להיות לא פחות מקטסטרופה.
במסגרת הפוסט, נעסוק בנושא קצת מדכא, של סיכויי השרידות (או לחילופין התמותה) מהוירוס.
ולמרות הנושא, ואולי דווקא בגללו – מדובר בדוגמה שממנה נוכל ללמוד הכי הרבה על איך לפרש דאטה בצורה נכונה, שתאפשר לנו לבצע את הפעולות הנכונות;
במקרה הזה מדובר בהצלת נפשות, במקרים אחרים מדובר בהצלת חברות.
וממש לפני שנתחיל, חשוב להבהיר משהו.
אנחנו אמנם מדברים כאן על מיני תופעות ונתונים של חולים ושל נפטרים ברמה הסטטיסטית;
ויחד עם זאת, חשוב להבין שמדובר כאן בטרגדיה של ממש עם אנשים אמיתיים שחלו ונפטרו, והמשפחות שלהם שסובלות מאוד.
לכן, חשוב להתייחס לנתונים האלה ביראת קודש – לא פחות, ולהיות מאוד רגישים למשמעות של הנתונים על חיים של אנשים.
וזה, אגב, נכון לגבי נתונים מכל סוג.
זו חלק מהאחריות שלנו בתור אנליסטים.
אז אחרי כל ההקדמות – בואו נתחיל.
"למי קראת מוטה?"
אחת הבעיות בניתוח השרידות/ תמותה מהוירוס היא שלא מדובר בתהליך מיידי.
אם ניקח לדוגמה את עולם השיווק הדיגיטלי, ונסתכל על מסע לקוח טיפוסי, נוכל לראות שהוא יחסית מיידי;
לרוב, הוא מתרחש כולו במהלך ביקור אחד (ביקור >> הרשמה >> רכישה), או בטווח של ימים ספורים לכל היותר.
לעומתו, תהליך התפתחות הוירוס לוקח זמן.
אם נמפה את השלבים השונים של תהליך התפתחות הוירוס – נוכל להציגם כך:
הדבקה >> סימפטומים >> אבחון חיובי >> הידרדרות למצב קשה / צורך בהנשמה >> שיפור / תמותה >> החלמה.
בין כל שני שלבים עוברים בממוצע מספר ימים עד כשבוע, כך שבסה"כ התקופה מרגע ההדבקה ועד לנקודה שמישהו נפטר חס וחלילה – עשויה לארוך גם מספר שבועות.
הנקודה הזו כבר הופכת את החיזוי והמידול של תוצאות הוירוס למורכבת מהרגיל.
הערה חשובה לגבי התרשים: לאור היעדר נתונים כמותיים רשמיים, מדובר בהמחשה בלבד של תהליך התפתחות המחלה, והמשך של כל שלב אצל כל סוג חולה עשוי להיות שונה בצורה מהותית. בהחלט ייתכן, כי המשכים בשלבים השונים יהיו לא מדויקים, כנ"ל לגבי הפרופורציות.
איך מחשבים את שיעור השרידות / תמותה?
המדד בו משתמשים כיום להשוואה בין מדינות הוא שיעור התמותה העדכני.
שיעור התמותה = היקף הנפטרים המצטבר עד היום, לחלק בהיקף הנדבקים המאובחנים עד היום.
הנה כמה דוגמאות מייצגות לשיעור התמותה במדינות נבחרות:
- נתונים מאתר Worldmeters
לדוגמה, אם נכון לרגע זה (30/03/2020 בשעה 12:00) אובחנו בישראל 4,347 חולים בקורונה, ומתוכם נפטרו למרבה הצער 16 איש, אזי שיעור התמותה הוא היחס ביניהם – כלומר 0.37%.
במקביל, היקף המחלימים עומד על 134 איש.
במקביל, באיטליה מדובר ב-97,689 נדבקים, מתוכם 10,779 נפטרו, כלומר שיעור התמותה הוא 11%.
במקביל, החלימו 13,030 איש.
היחס הזה אמנם מאפשר השוואה מספרית בין מדינות – כך שלדוגמה באיטליה שיעור התמותה הוא פי 32 (!) מאשר בישראל.
הבעיה היא, שהחישוב הזה לא ממש משקף את שיעור השרידות האמיתי, ובטח שלא מספר את כל הסיפור…
מדוע? בגלל מספר סיבות…
הטיית "שרידות" (Survivorship Bias)
במהלך מלחמת העולם השניה, מטוסי בעלות הברית שחזרו מטיסות מעל גרמניה, סבלו מפגיעות לא פשוטות – בעיקר במרכז הכנפיים והגוף.
כתוצאה מכך, עלתה השאלה – האם להוסיף מיגון למטוסים במקומות שבהם זוהו הפגיעות במטוסים.
אך למרות הפגיעות, הוחלט להוסיף את המיגון דווקא באיזורי שבהם לא היו כלל נזקים למטוסים – במנועים, בזנב ובאיזור תא הטייס.
מדוע?
כי הפגיעות זוהו רק במטוסים שחזרו!
כלומר, שהיעדר הנזקים באיזור המנועים, בזנב ובאיזור תא הטייס, לא העיד על כך שכלל לא היו שם פגיעות;
האמת היתה הרבה יותר מרה:
פגיעות באיזורים האלה במטוס היו קטלניות – עד כדי כך שהמטוסים הופלו ולא חזרו לבסיס.
ההטיה הזו נקראת בשם Survivorship Bias.
קרדיט: "McGeddon" (מתוך wikipedia)
ואיך זה רלוונטי לקורונה?
בשני אופנים: הטיה בהיקף הנפטרים, והטיה בהיקף הנדבקים.
הטיה בהיקפי הנפטרים – שילוב של הטיית שרידות עם הטיה בחירה (Selection Bias)
כי כמו שראינו קודם, תהליך התפתחות המחלה הוא ארוך.
כתוצאה מכך, רק לאחר מספר שבועות נוכל להבין אם חולה יחלים או לא.
ומי שאובחן אתמול כחולה, עדיין לא עבר מספיק זמן על מנת להבין אם יצליח להתאושש;
את זה נדע רק תוך מספר שבועות.
במילים אחרות: היקף הנפטרים נכון להיום משקף את היקף הנדבקים מלפני מספר שבועות.
וכאשר יש לנו הדבקה מעריכית (אקספוננציאלית), והיקף הנדבקים עולה בקצב הולך וגדל בכל יום – המכנה של שיעור התמותה מוטה עוד יותר.
חשוב לציין, שההיבט של הטיית השרידות כאן הוא לא בשם (Survivorship), אלא בעצם העובדה שאנחנו מסתכלים על אוכלוסייה מסוימת, שהתוצאה לגביה עדיין לא ודאית (חולים בטיפול) – ובטעות אנחנו מחשיבים את כולה כבעלת תוצאה של הישרדות.
בדיעבד, נוכל כמובן לבדוק עבור כל נדבק האם הוא התאושש או לא, ומשם לחשב את שיעור התמותה/שרידות.
הטיה בהיקף הנדבקים
בנוסף להטיית השרידות בהיקפי הנפטרים, עוד אופן להטיית שרידות קיימת לנו גם בהיקפי הנדבקים.
זה נובע בגדול מנדבקים א-סימפטומטיים, וממדיניות הבדיקות.
נדבקים א-סימפטומטיים
קיימת השערה המוכרת ממגיפות קודמות, שלפיה קיימים הרבה מאוד חולים שהם א-סימפטומטיים, כלומר אינם מראים כלל סימפטומים של הוירוס.
ככל הנראה, מדובר בעיקר באנשים צעירים עם מערכת חיסונית יחסית חזקה – ש"אוכלת בלי מלח את הוירוס".
מאחר ואנשים אלה כלל לא מגלים סימפטומים, אין לנו אפשרות לדעת שגם הם נדבקו בוירוס.
הם כמובן צריכים להיכנס גם למכנה של כמות הנדבקים.
כרגע אין ממש ודאות לגבי שיעור הלא סימפטומטיים מכלל הנדבקים, אך הערכות מדברות על איזור פי 10.
וכמובן שאם מספר הנדבקים האמיתי יתברר כגבוה פי 10 מהמאובחנים, שיעור התמותה יתברר כעשירית מהחישובים – וזה דיון מאוד חשוב בקהילה הרפואית, לצורך תכנון הצעדים הנדרשים לטיפול בהתפשטות.
- המספרים לצורך המחשה בלבד של השוני בין החישוב לפי היקף המאובחנים למול כלל הנשאים.
בשפה הרפואית מדד זה נקרא IFR – או (Infected Fatality Rate), הכולל את כלל הנדבקים, למול CFR – או (Cnfirmed Fatality Rate), הכולל את כלל המאובחנים שזוהו כנשאים/חולים.
במקרים רבים בהתפשטות וירוסים – ייתכן וכלל לא יתאפשר לזהות את כלל הנדבקים, בפרט אם אין להם סימפטומים, ולכן ה-IFR מהווה בשלב הזה הערכה בלבד.
הדרך היחידה לבדוק את הנתון הזה היא באמצעות בדיקות נרחבות מאוד – בעיקר סרולוגיות (בדיקת נוגדנים בדם), וככל הנראה זה מה שיבוצע במהלך השבועות/ חודשים הקרובים.
הטיה באוכלוסיית הנבדקים
בנוסף, בכל מדינה קיימת מדיניות אחרת לבדיקה של נשאות של הוירוס.
מאחר וכמות הבדיקות מוגבלת – בין אם ע"י ציוד הבדיקות (מטושים / ערכות), ובין אם ע"י קיבולת המעבדות – נדרש לתעדף את מי לבדוק קודם.
וכאן קיימת שונות אדירה בין המדינות.
אם ניקח לדוגמה את איטליה – קיימים בה היום כ"כ הרבה חולים, שאין באמת אפשרות לאבחן את כולם, וככל הנראה בודקים רק את מי שמגיע לבתי החולים.
כתוצאה מכך, מלכתחילה מדובר באוכלוסייה בסיכון, כי הרי לא היו מגיעים לבתי החולים אם המצב לא היה גרוע.
וזו גם ככל הנראה הסיבה לשיעור התמותה הגבוה כ"כ – בודקים בעיקר אנשים במצב קשה שהגיעו לבתי החולים – חלק גדול מהר קשישים.
לעומתם, בדרום קוריאה או בגרמניה, מבוצעות עשרות ואפילו מאות אלפי בדיקות ביום – כבר מימי ההתפרצות הראשונים.
שם המדיניות היא לבדוק האוכלוסייה בצורה מסיבית, לרוב במרכזי בדיקות דוגמת ה-Drive Through ('היבדק וסע').
ומאחר והמרכזים האלה נמצאים מחוץ לבתים, קיימת שם הטיה יותר חזקה לכיוון הצעירים והבריאים, שכן הקשישים או בעלי מחלות הרקע נשארים בבתים ולכן מיוצגים בחסר.
זו כנראה הסיבה לשיעור התמותה הנמוך.
הנה תרשים מכתבה באתר בלומברג הממחישה את זה בצורה יפה:
מדיניות כזו גורמת להטיית בחירה (Selection Bias) בהיקפי הנדבקים, שכן אנחנו בוחרים להסתכל רק על מטופלים בעלי סימפטומים מסוג מסוים, ולא על כלל האוכלוסייה.
ומה עם ישראל?
בישראל ככל הנראה ישנו סיפור דומה לדרום קוריאה ולגרמניה – אבל עם טוויסט…
חשוב להדגיש, שזו פרשנות, ולא עובדות, אבל ישנם איתותים לכך בנתוני התפלגות הגילאים של הנדבקים.
אם אתם זוכרים, הנדבקים הראשונים בישראל היו מטיילים או אנשי עסקים שחזרו מחו"ל.
ומה מאפיין לרוב מי שמטייל בחו"ל?
נכון – יחסית צעירים ובמצב רפואי טוב.
בנוסף, גם המעגלים הקרובים אליהם – חברים בעיקר – הם עדיין צעירים.
ומאחר ומדיניות הבדיקות היתה ממוקדת או בשבים מחו"ל או במגע עם חולים מאומתים (שברובם חזרו מחו"ל…) – זה ככל הנראה יצר הטיה לצעירים עם מצב רפואי טוב.
מנתוני משרד הבריאות ניתן להסיק שזה אכן המצב (כ-81% מהנדבקים בגילאים נמוכים מ-60 – בדומה לגרמניה).
וזו ככל הנראה הסיבה שאנחנו עומדים על שיעור תמותה נמוך.
בנוסף, ככל הנראה הצעדים האגרסיביים שנקטו הממשלה ומשרד הבריאות סייעו להבנה אצל אנשים מבוגרים או בעלי מחלת רקע שעליהם לשמור על עצמם.
לכן היקף ההדבקות בקרב מגזר זה שנמצא בסיכון – יחסית נמוך (ונקווה שלא תהיינה עוד התפרצויות בבתי אבות – חייבים לשמור על הקשישים).
אז מה צפוי לנו?
לאורך זמן, וככל שמעגל ההדבקה מתרחב – בעיקר בקרב המגזר החרדי אך לא רק – כנראה שאנחנו צפויים לראות עוד הדבקות בקרב האוכלוסיות בסיכון – ולכן שיעור התמותה צפוי למרבה הצער לעלות – ואפילו באופן משמעותי.
זה קרה בדרום קוריאה, קורה בגרמניה – וככל הנראה יקרה גם בישראל.
אז עד לכמה עשוי שיעור התמותה לגדול?
כמובן שאנחנו לא נביאים, אבל השאיפה שהוא לא יגיע חס וחלילה לרמה של איטליה וספרד, אלא יותר לרמה של דרום קוריאה – (סביב 1.5%-2% מתוך המאובחנים – בשלב זה נשים בצד את הא-סימפטומטים).
ונקווה כמובן שהרופאים הגיבורים שלנו (ללא טיפה של ציניות) יעזרו להקטין אותו אפילו יותר.
זה עדיין למרבה הצער (וכמובן שכל חולה שנפטר הוא טרגדיה) לא מעט נפטרים, אך ככל שנשמור על ההנחיות של משרד הבריאות – יש לנו סיכוי טוב להצליח.
לכן, ככל הנראה שהדרך להתמודד עם וירוס הקורונה היא להמשיך לבצע בדיקות בצורה מסיבית, ובמקביל לבודד את האנשים שנדבקו בשלב מוקדם ככל הניתן, ובכך למנוע המשך הדבקה – במיוחד בקרב האוכלוסיה בסיכון.
אז תשמרו על עצמכם ועל המשפחות בבידוד ותהיו קשובים להנחיות.
בתקווה שיהיה לכולנו קל בסגר (ובליל הסדר/סגר), והעיקר הבריאות!