יחידה 6: חי בריבוע  >> 6.3:  בדיקת נורמליות

בדיקת נורמליות

 

ניתן להשתמש במבחן חי בריבוע לטיב התאמה ע"מ לבחון האם מדגם לקוח מאוכלוסייה בעלת התפלגות נתונה. בפרט נוכל לבדוק האם מדגם לקוח או לא מאוכלוסייה בעלת התפלגות נורמלית. מבחן זה משמש בין השאר לצורך בחינת הנחת הנורמליות טרם ביצוע מבחנים פרמטרים. קיימים מבחנים משוכללים יותר כמו: Kolmogorov-Smirnov או Anderson-Darling. השערת האפס טוענת שהמדגם לקוח מאוכלוסייה נורמלית, לכן מטרת החוקר היא לא לדחות את .

על מנת לחשב את הסטטיסטי עלינו לחלק את הנתונים לקטגוריות, זאת כדי שבכל קטגוריה נוכל לחשב את  ואת .  גודל הקטגוריות (bins) עלול להשפיע על תוצאות המבחן. חיסרון של המבחן הוא שדורש גודל מדגם מינימלי על מנת שהקירוב של חי בריבוע יהיה תקף..

בהתבסס על ממוצע וסטיית התקן של המדגם, ניתן לחשב כמה ערכים אמורים ליפול בכל קטגוריה בהנחת נורמליות. אנו מחשבים את ה-exp בהתאם להתפלגות הנורמלית. חי בריבוע מובהק אומר שיש פער בין obs לבין exp. אם דוחים את השערת האפס ההתפלגות היא לא נורמלית, אם לא אז ניתן לומר שהיא בקירוב נורמלית.

כמו בכל חישוב של חי בריבוע, נבדוק עד כמה הערכים הנצפים סוטים מהערכים הצפויים.

שלבים:

מחלקים את הנתונים לקטגוריות (רצוי שוות רוחב).

חישוב הערכים הצפויים לכל קטגוריה:

כאשר F היא פונקצית ההתפלגות הנורמלית המצטברת,  הוא הגבול העליון האמיתי של הקטגוריה ו-  הוא הגבול התחתון האמיתי.

אנו נמיר את ערכי ה-  ו-  לציוני תקן, נבדוק את השטח ביניהם באמצעות טבלת z, ובכדי לחשב מהי השכיחות הצפויה , נכפיל את ההסתברות שמצאנו (שטח) ב- .

זאת פונקציה של הסתברות מצטברת של ההתפלגות הנורמלית, ונקראת אוגייבה

את ערכי הפונקציה ניתן לחשב ב-EXCEL או להיעזר בטבלת ההתפלגות הנורמלית (לאחר המרת גבולות הקטגוריות לציוני z). הפקודה NORMDIST בצורתה הבאה ממירה את הציונים הגולמיים לציוני תקן ואז מחזירה לנו כרגיל את השטח עד לערך .

דוגמא:

להלן נתוני המחקר לאחר שקובצו ל-6 קטגוריות (לצורך הדוגמא בלבד - בחיים רצוי 10 קטגוריות ומעלה). האם ניתן לומר, ברמת בטחון של 95%, שלקוחים מאוכלוסייה המתפלגת נורמלית?  

 

פתרון:

 

 

תחילה אנו מחשבים את ציון התקן של הגבול התחתון והגבול העליון של הקטגוריה בעמודה "d-c" אנו מחשבים את השטח שתופסת כל קטגוריה על ידי חישוב ההפרש בין ציוני התקן של הגבול העליון והתחתון של הקטגוריות

 המדגם לקוח מהתפלגות נורמלית.

 המדגם אינו לקוח מהתפלגות נורמלית.

 

 

לכן לא ניתן לדחות את  ברמת בטחון של 95%. לא ניתן לומר שהמדגם לקוח מאוכלוסייה בעלת התפלגות לא נורמלית.

► חזור                    המשך ◄