יחידה 8: מדדי מיקום יחסי ומדדי פיזור  >> 8.1: שונות וסטיית תקן

שונות וסטיית תקן

 

השונות הינה "ממוצע ריבועי המרחקים מהממוצע".

מדוע אנו מעלים את המרחקים בריבוע?

משום שאחת מתכונות הממוצע היא שסכום המרחקים ממנו היא .

באופן תיאורטי ניתן היה להשתמש בערך המוחלט של הסטיות מהממוצע, אולם מדד זה לא זכה לתהילה סטטיסטית, ולמרות שאפילו קיבל שם הוא לא חלק מארגז הכלים של סטטיסטיקאים:

 

 

 עתה נגדיר שונות וסטיית תקן.

שונות (variance)

 

 

כאשר מדובר בשונות בתוך המדגם, הרי מדובר בסטטיסטי ולכן משתמשים באות לטינית:

 

 

כאשר מדובר בשונות באוכלוסיה, הרי מדובר בפרמטר ולכן משתמשים באות יוונית:

 

 

:  ניתן גם להגדיר שונות כתוחלת של ריבוע ההפרשים שבין ערכי התצפיות מממוצע ההתפלגות.

סטיית תקן (standard deviation)

 

סטיית התקן היא בעצם שורש השונות.

 

סטיית התקן של המדגם מסומנת :

 

 

סטיית התקן באוכלוסייה:

 

   

אומדן לסטיית תקן של האוכלוסייה בהסתמך על המדגם:

נוסחת עבודה לצורך חישוב סטיית תקן:

 

ידוע ש:

 

ניזכר ש: .  

 

נציב בנוסחא ונצמצם את הגורמים הדומים:

 

זוהי נוסחת העבודה איתה נוכל לחשב שונות בצורה קלה: .

 

והשונות באוכלוסייה:

 

ובמונחים של תוחלת:

חישוב סטיית תקן מטבלת שכיחויות

 

 

 היא נקודת האמצע של הקטגוריה ה-j (מתוך k)

 

אז למה אפשר להתייחס לשונות כאל תוחלת?

 

פקודות EXCEL

 

בכדי לחשב את השונות בתוך המדגם נשתמש בפקודת VARP, ולצורך סטיית התקן בתוך המדגם נשתמש בפקודה STDEVP. בפקודות אלו מחולק המונה של נוסחת השונות ב-n.

 

 

לצורך חישוב האומדן הבלתי מוטה של השונות נשתמש בפקודת VAR, ולצורך האומדן לסטיית התקן נשתמש בפקודה STDEV. בפקודות אלו מחולק המונה של נוסחת השונות ב-n-1.

 

► חזור                    המשך ◄