שאלות נפוצות - מדדי מיקום יחסי ומדדי פיזור

לקורס המקוון

 

לדף הראשי

1. שאלה:

לא לגמרי סגור על התפלגות: איך אני מחליט אם היא חיובית או שלילית? ומה זה אומר לי?

 

פתרון:

התפלגות סימטרית היא פשוט התפלגות (כמו שמציע שמה) סימטרית. הממוצע (mean) והחציון שלה שווים בדיוק (אבל לאו דווקא השכיח), ואם נחצה אותה בנקודה זאת, צידה הימני יהיה בדיוק תמונת מראה של צידה השמאלי (אבל בדיוק).  לדוגמא בציור הזה.  בדוגמא ניתן לראות שבחלק מההתפלגויות הסימטריות לחלוטין, הממוצע מתלכד עם החציון אבל הם לא שווים לשכיח.
מדד ה-skewness מודד סימטריה (ע"פ היחס בין הממוצע והחציון), וכשערכו המוחלט קטן מ-0.5, נגיד שההתפלגות סימטרית בקירוב. כלומר, מספיק סימטרית בשביל שנתייחס אליה ככזאת (ונוכל, למשל, להשתמש במדדי ממוצע ושונות).
כשה-skewness גדול מ-0.5, ההתפלגות כנראה מוטה לצד כלשהו.
בהתפלגות מוטה חיובית (ה-sk גדול מ-0.5), הצד הימני של ההתפלגות קצת יותר דומיננטי ונמשך ימינה, יוצר זנב ימני בהתפלגות, ומושך אחריו את הממוצע (הרבה) והחציון (פחות) ימינה.
בהתפלגות מוטה שלילית (ה-sk קטן מ-0.5-), הצד השמאלי של ההתפלגות קצת יותר דומיננטי ונמשך שמאלה, יוצר זנב שמאלי בהתפלגות, ומושך אחריו את הממוצע (הרבה) והחציון (פחות) שמאלה. לדוגמא כאן. המשיכה החזקה הצידה של הממוצע גורמת למדד זה לייצג בצורה פחות טובה את ההתפלגות, ולכן כשההתפלגות לא מספיק סימטרית (מוטה יותר מדי ימינה או שמאלה), נשתמש בחציון ו-SIR כמדדים. מדדים אלה פחות מושפעים מערכים קיצוניים, ולכן כשיש ערכים קיצוניים בצד אחד של ההתפלגות והם ייגרמו להטיה חזקה לאותו צד, החציון וה-SIR לא יושפעו כ"כ וייצגו טוב יותר את האוכלוסייה.

באופן כללי, ה-sk יהיה גדול מאפס בהטיה קלה ימינה וקטן מאפס בהטיה קלה שמאלה, אבל כל עוד ההטיה לא חזקה מדי (ה-sk קטן מ-0.5), ההתפלגות (מספיק) סימטרית מבחינתנו.