יחידה 4: המשך הסתברות  >> 4.1: נוסחת בייס

נוסחת בייס (Bayes)

משפט בייס, או חשיבה בייסיאנית, משתמשים בחוקי ההסתברות המותנה בכדי לאמוד הסתברות של מאורע מסוים לאור הסתברות הבסיס להתרחשותו.

ראינו שלפי נוסחת ההסתברות המותנה: .

לכן: .

זו צורתו הבסיסית של משפט בייס.

 

אבל:

 

לכן: .

 

זו צורתו המתקדמת של משפט בייס.

מתוך עבודתם של עמוס טברסקי ודניאל כהנמן (1982):

Tversky, A., & Kahneman, D. (1982). Evidential impact of base rates. In Kahneman, D., Slovic, P., & Tversky, A. (Eds.), Judgment under uncertainty: Heuristics and biases. Cambridge: Cambridge, University Press

 

דמיין שאתה שופט בתאונת פגע וברח, בה מונית פגעה בהולך רגל. העד היחיד הוא קשיש אשר ראה את התאונה מחלונו המרוחק, וטוען שראה מונית כחולה.

העובדות העומדות בפנייך הן: בעיר 2 חברות מוניות בלבד (ירוקות או כחולות). בליל התאונה 85% מהמוניות בעיר היו ירוקות ו-15% כחולות.העד עבר מבחן ראייה בתנאים דומים לאלו של ליל התאונה, והתברר שהוא מבחין נכונה בין מונית ירוקה לכחולה ב-80% מהמקרים. על סמך נתונים אלו איזה חברת מוניות היית תובע?

שופט "טיפוסי" מול עד ש"הוכיח את עצמו" ב-80% מהמקרים יתבע את חברת המוניות הכחולות. יתרה מכך, סביר שיטען שהסיכוי שהמונית הייתה כחולה הוא 80%.

עם זאת סטטיסטית, הסיכוי (שנחשב בהתבסס על נוסחת בייס) שהמונית כחולה הוא 41%, דהיינו הסיכוי שהמונית ירוקה גדול יותר.

הסבר:

אם העד לא הבחין בצבע המכונית אך בטוח שראה מונית, הרי שהסיכוי שהמונית ירוקה הוא 85%.

לכן אם מדובר במונית הרי שלפני העדות לגבי הצבע, הסיכוי האפריורי שהמונית כחולה הוא רק 15%. לאחר העדות, הסיכוי הפוסטריורי עולה, אך לא לרמה של 80% (שהיא רמת הדיוק של העד).

בחיים רופאים טועים באותה הטעות (דוגמה בהמשך).

".... אבל ראיתי זאת במו עיניי..."

האבולוציה והניסיון לא העניקו לנו חוש למידע אבסטרקטי המבוסס על אוכלוסיות גדולות שלא ניתן לראות.

השופט לא "רואה" את האינפורמציה שרק 15% מהמוניות היו כחולות. יתרה מכך, סביר להניח שגם לאחר ההסבר הבייסיאני הוא לא ישנה את גזר דינו.

לפי טברסקי וכהנמן, אנו עושים שימוש בheuristics- (קיצורי דרך קוגניטיביים), ובמקרה זה של תכונת הייצוגיות, שהעיקרית מביניהן היא מידת הדמיון בין הפרט לבין קבוצה מסוימת, מבלי לקחת בחשבון את הפרופורציה של גודל קבוצת הייצוג מתוך כלל האוכלוסייה.

ולדרך הלוגית/סטטיסטית באמצעות נוסחת בייס:

 

נגדיר:

·         A המונית כחולה

·         B העד אמר שהמונית כחולה

 

 

 

כלומר שבפועל אם העד אומר שהמונית כחולה, אזי הסיכוי שבמציאות בעת התאונה המונית היתה כחולה הוא רק 41.3%. זאת מכיוון שיחס הבסיס (שימו לב: באנגלית Base Rate ואין לבלבלו עם שם הממציא Bayes) בין המוניות הירוקות והכחולות בעיר הוא כזה שעיקר המוניות בעיר הן ירוקות ולכן למרות זיהוי העד את המונית ככחולה עדיין הסיכוי שבמציאות המונית היתה ירוקה גבוה יותר.

דוגמה מהחיים: בשנות ה-80, בחור הומוסקסואל שנמצא כנשא חיובי בבדיקה למחלת ה-AIDS התאבד. באותם הימים הסיכוי של הומוסקסואל לחלות ב-AIDS היה 1/250. הבדיקה דייקה ב-100% עבור אנשים חולים (hit rate), אך טעתה ב-3% מהמקרים עבור בריאים (false alarm). הבחור היה בריא!

סטטיסטית, הסיכוי שלו להיות חולה לאחר קבלת תשובה חיובית הוא 12% בלבד.

 

 

במחקר מסוים, רופאים התבקשו להעריך את הסיכוי האמיתי שאישה אכן חולה בסרטן, עם קבלת תשובה חיובית בבדיקה מסוימת. למרות ידיעתם את הסיכוי של האישה לחלות בהתאם לגילה (base rate),  וידיעת ה-hit rate ו-false alarm של הבדיקה, הם העריכו בממוצע את הסיכוי כ-80-90%, למרות שבפועל הסיכוי היה 7.5% בלבד.

► חזור                    המשך ◄