יחידה 9: רגרסיה וניבוי לינארי  >> 9.5:  פירוק שונויות

פירוק שונויות

ראינו ש:

 

לכן ממוצע y שווה לממוצע הערכים המנובאים:  וגם .

 

 

ה-covariance הוא השונות המשותפת וגם מונה נוסחת המתאם ומכיוון שהמתאם בין y' לטעות  הוא אפס (אחת מדרישות הרגרסיה) הרי שה-cov חייב להיות 0.

לכן ניתן לפרק את השונות של y לסכום השונות של הניבויים ושל הטעויות.

 

 

שונות הניבויים/השונות המוסברת היא פונקציה של המתאם – ככל שהוא גדול יותר, השונות המוסברת גדלה.

שונות טעויות + שונות ניבויים = שונות y

מונה השונויות נקרא SS=Sum of Squares – סכום הריבועים:

שונות הניבויים/השונות המוסברת

 

השונות שבין הנקודות שעל הקו

שונות הטעויות

 

השונות שבין הנקודות מסביב לקו

סה"כ שונות של y

 

השונות שבין הנקודות סביב הממוצע

 

 - הנוסחא זהה לנוסחא לעיל אלא שמכפילים את השונויות ב-N ואז מקבלים את סכום הריבועים.

כאשר המתאם שווה ל-0 יש קו מקביל לציר ה-x ולכן אין שוני בין הניבויים. במצב זה כל השונות של y היא שונות טעויות:

לעומת זאת כאשר המתאם שווה ל-1 אין טעויות סביב הקו כך שאת כל שונות y הצלחנו לשחזר באמצעות x:

הוכחה שאחוז השונות המוסברת שווה ל-r2

ניתן להוכיח (בקלות) ש:  אחוז השונות המוסברת.

במדגם: אחוז השונות המוסברת שווה .

השונות בין הערכים המנובאים היא שונות הערכים המנובאים סביב ממוצע הקו (שהוא גם ממוצע ערכי ה-y):

 

 אחוז השונות המוסברת

 

   שונות מוסברת = שונות הניבויים

 

אבל מאחר ו: ,

   שונות לא מוסברת = שונות הטעויות

 

נוסחה זו, , נכונה באוכלוסיה או בתוך המדגם עצמו.

כי בשני המקרים המכנה של השונויות זהה עבור כל האיברים:  N באוכלוסייה או n במדגם.

 

לגבי האומדנים של השונויות (S), דרגות החופש לא זהות עבור השונויות השונות לכן השוויון איננו מתקיים: באוכלוסיה יש n-1 דרגות חופש אך בשונות הניבויים/המוסברת ובשונות הטעויות יש n-2 דרגות חופש (משום שהן כוללות את חישוב המתאם המבוסס עלי שונויות שבחישובן השתמשנו גם בממוצע x וגם בממוצע y ולכן איבדנו שתי דרגות חופש).

ביישומון הבא ניתן לראות הדמיה של השפעת המרכיבים השונים על קו הניבוי, השונות המוסברת והבלתי מוסברת:

ניתן להכניס ערכים בצד שמאל וללחוץ על animate בכדי לראות את השתנות : השיפוע, שונות הניבויים ושונות x. ולראות את ההשפעה של כל אחד מהם על גודל ואחוז השונות המוסברת (עמודה כחולה) והבלתי מוסברת (עמודה אדומה). כמו כן ניתן לראות מתחת למקום הזנת הערכים את המתאם בין x ל-y ואת סה"כ שונות y.

► חזור                    המשך ◄