יחידה 8: מדדי מיקום יחסי ומדדי פיזור >> 8.1: שונות וסטיית תקן |
שונות וסטיית תקן
השונות הינה "ממוצע ריבועי המרחקים מהממוצע". מדוע אנו מעלים את המרחקים בריבוע? משום שאחת מתכונות הממוצע היא שסכום המרחקים ממנו היא . באופן תיאורטי ניתן היה להשתמש בערך המוחלט של הסטיות מהממוצע, אולם מדד זה לא זכה לתהילה סטטיסטית, ולמרות שאפילו קיבל שם הוא לא חלק מארגז הכלים של סטטיסטיקאים:
עתה נגדיר שונות וסטיית תקן. |
שונות (variance)
כאשר מדובר בשונות בתוך המדגם, הרי מדובר בסטטיסטי ולכן משתמשים באות לטינית:
כאשר מדובר בשונות באוכלוסיה, הרי מדובר בפרמטר ולכן משתמשים באות יוונית:
: ניתן גם להגדיר שונות כתוחלת של ריבוע ההפרשים שבין ערכי התצפיות מממוצע ההתפלגות. |
סטיית תקן (standard deviation)
סטיית התקן היא בעצם שורש השונות.
סטיית התקן של המדגם מסומנת :
סטיית התקן באוכלוסייה:
אומדן לסטיית תקן של האוכלוסייה בהסתמך על המדגם: |
נוסחת עבודה לצורך חישוב סטיית תקן:
ידוע ש:
ניזכר ש: .
נציב בנוסחא ונצמצם את הגורמים הדומים:
זוהי נוסחת העבודה איתה נוכל לחשב שונות בצורה קלה: .
והשונות באוכלוסייה:
ובמונחים של תוחלת: |
חישוב סטיית תקן מטבלת שכיחויות
היא נקודת האמצע של הקטגוריה ה-j (מתוך k)
אז למה אפשר להתייחס לשונות כאל תוחלת?
|
פקודות EXCEL
בכדי לחשב את השונות בתוך המדגם נשתמש בפקודת VARP, ולצורך סטיית התקן בתוך המדגם נשתמש בפקודה STDEVP. בפקודות אלו מחולק המונה של נוסחת השונות ב-n.
לצורך חישוב האומדן הבלתי מוטה של השונות נשתמש בפקודת VAR, ולצורך האומדן לסטיית התקן נשתמש בפקודה STDEV. בפקודות אלו מחולק המונה של נוסחת השונות ב-n-1.
|
|