יחידה 7: מדדי מיקום יחסי ומדדי פיזור  >> 7.2: טווח וחצי התחום הבין-רבעוני

מדדי פיזור

 

לכל התפלגות יש שני סוגים של ערכים היכולים לתאר אותה: מדדי מרכז עליהם דיברנו בשיעורים הקודמים, ומדדי פיזור המתארים את מידת הפיזור/הומוגניות של ההתפלגות. רק הידע הכולל את שני מדדים אלו יחד מספק לנו מידע יחסית מקיף על צורת ההתפלגות.

 

 

לדוגמא, יכולה להיות התפלגות בעלת ממוצע של 3 שכולה מורכבת מהערך 3. לעומת זאת, יכולה להיות התפלגות בעלת אותו ממוצע הכוללת ערכים שונים לחלוטין, ועל כן חשוב לדעת בנוסף למדד המרכז של ההתפלגות את מדד הפיזור שלה.

 

אנו נלמד על שלושה מדדי פיזור: טווח (range), חצי התחום הבין-רבעוני (SIR) ושונות/סטיית תקן (variance/standard deviation).

 

בסוף נושא זה נלמד אף כיצד נחליט באילו מדדי מרכז ופיזור נשתמש לתיאור התפלגויות שונות בצורה הנכונה ביותר.

טווח (range)

 

כשמו כן הוא – המרחק בין הערך הגבוה בהתפלגות לערך הנמוך בהתפלגות. רצוי לציין את הטווח המלא (בין הגבולות האמיתיים) ולכן מוסיפים 1, אך זהו אינו פרט מהותי.

 

 

הטווח מושפע מאוד מערכים קיצוניים, או למעשה מושפע לחלוטין מהוספת ערכים קיצוניים. כך, למעשה, אם כל ערכי ההתפלגות הינם 1,1,1,1,1,2,2,2,2,3,3,3,3  הטווח הוא 3-1+1=3. אם נוסיף כעת את הערך 100 אזי הטווח יגדל להיות: 100-1+1=100.

ניתן לראות שהטווח לא נותן לנו מידע רב על פיזור הערכים בתוך ההתפלגות.

חצי התחום הבין-רבעוני (semi-interquartile range, SIR)

 

ה-SIR הוא המרחק הממוצע בין הרבעונים לחציון.

האחוזון ה-25 מכונה הרבעון הראשון, Q1, והאחוזון ה-75 מכונה הרבעון השלישי, Q3.

 

 

 = רבעון 1

 = רבעון 3

 

לצורך חישוב ה-SIR יש להשתמש בנוסחת האחוזון, למצוא את האחוזון ה-75, האחוזון ה-25, לחשב את ההפרש ביניהם, ולאחר חלוקה ב-2 מתקבל ה-SIR.

 

כאשר מדד המרכז המתאים לתיאור התפלגות הינו החציון אזי מדד הפיזור המתאים יהיה ה-SIR (הם זוג ותמיד מציגים ביחד את ההתפלגות).

כמו החציון, ה-SIR מושפע מעט מערכים קיצוניים.

 

בתרשים הבא ניתן להתרשם מהו ה-IR (ה-(Inter Quartile Range בהתפלגויות שונות, ולראות שהוא אכן לא מושפע מערכים קיצוניים:

 

כאשר ההתפלגות סימטרית:  

 

לעומת זאת כאשר ההתפלגות הינה מוטה (כפי שניתן לראות בתרשים מטה), נוסחאות אלו אינן מתקיימות משום שהמרחק בין החציון (med) לכל אחד משני הרבעונים אינו שווה:

 

► חזור                    המשך ◄