יחידה 11: מתאם מרובה  >> 11.1: מתאם מרובה

מתאם מרובה

 

המטרה היא להסביר כמה שיותר שונות מהמשתנה המנובא (y), אך עם זאת עדיין להיות מסוגלים ליישם את המודל על מדגמים אחרים.

לרוב, במדעי החברה, אחוז השונות אשר משתנה בודד יסביר מתוך משתנה אחר יהיה נמוך.

במעגלי וון: כל מעגל מייצג את מלוא השונות של כל משתנה.

 

אנו נרצה להוסיף עוד משתנים על מנת להסביר חלק גדול יותר משונותו של y. מעכשיו יהיה לנו משתנה תלוי אחד, ומספר משתנים מסבירים ("בלתי תלויים"):

ה-  הוא החפיפה בין כל המשתנים עם y.

אנו מעוניינים שלכל אחד מהנבאים יהיה קשר כמה שיותר גבוה עם y, וקשר כמה שיותר נמוך ביניהם.

 

במילים אחרות, אנו רוצים שלכל אחד מהנבאים תהיה תרומה בלעדית כמה שיותר גבוהה.

ל-  יש קשר גבוה עם y אך תרומתו

 הבלעדית קטנה ביחס ל-

ל-  יש קשר נמוך יחסית עם y אך תרומתו

 הבלעדית גבוהה

המתאם המרובה מסומן

 

המתאם המרובה שווה לכל הפחות למתאם הנמוך מבין כל אחד מהמתאמים שבין הנבאים לבין y.

אחוז השונות המוסברת ברגרסיה המרובה יהיה בהכרח יותר גדול או שווה ל-אחוז השונות המוסברת של מה ש-  הסביר או ש-  הסביר (הגדול מבין השניים): ,

כאשר:

 

במצב האידיאלי אין מתאם בין שני המשתנים המנבאים, , ואז המתאם המרובה הוא מקסימלי (כל הביטוי השני במונה מתאפס) ובמצב כזה אחוז השונות המוסברת יהיה שווה לסכום השונות המוסברת של כל אחד מהמשתנים בנפרד: .

 

הנוסחה של  מורכבת יותר וכך גם הנוסחאות הגבוהות יותר.

בדיקת מובהקות:

 

המטרה היא להוסיף נבאים, אך לא יותר מדי, זאת בכדי שהניבוי לא יהיה ספציפי למדגם שדגמנו.

אם נוסיף יותר מדי נבאים על מדגם יחסית קטן, אנו עלולים להימצא במצב של over-fitting, דהיינו שהניבוי לא ניתן להכללה על מדגמים אחרים (כי בכל קבוצת נבדקים תמיד נוכל למצוא מאפיינים שייחודים רק אליהם).

 

עתה יש לבדוק את מובהקות הניבוי תוך התחשבות במספר הנבאים ומספר הנבדקים.

 

 

k = מספר הנבאים

 

זוהי נוסחא מקבילה לבדיקת מובהקות מתאם אלא שהכל מועלה בריבוע ולכן זוהי התפלגות F (  שווה ל-F עם דרגת חופש אחת במונה ו-  במכנה – דרגות החופש מ-t).

 

ברגרסיה מרובה דו משתנית, נוסחת הרגרסיה תהיה:

במקרה זה אנו בונים מישור ניבוי ולא קו ניבוי – כי יש לנו מערכת של שלושה צירים:

 

ובציוני תקן

 

כזכור, b אינו מוגבל בטווח הערכים שלו, אך  נע בין -1 ל-1.

ברגרסיה מרובה .

ברגרסיה מרובה ה-  לא שוות למתאמים אלא לתרומה הבלעדית של כל אחד מהנבאים.

 

 היא התרומה הבלעדית של  בהסבר של y מעבר למה ש-  מסביר (הכוללת את החלק היחסי מתוך החלק ששניהם מסבירים).

 

 

 

 

 

זוהי המחשה של מזעור הפיזור

 

 

 

כל  המאפיינים של הרגרסיה הפשוטה ממשיכים ומתקיימים גם לגבי הרגרסיה המרובה:

 

כמו שברגרסיה פשוטה , כך ברגרסיה מרובה .

כמו שברגרסיה פשוטה , כך ברגרסיה מרובה , משום ש-  הוא טרנספורמציה לינארית גם של  וגם של .

בכמה נבאים להשתמש?

 

תלוי בתרומה הבלעדית של כל משתנה. כל נבאי נוסף צריך להוסיף חלק משמעותי לאחוז השונות המוסברת.

רצוי ככלל אצבע להוסיף לפחות 30 נבדקים על כל משתנה נוסף ע"מ למנוע over-fitting והתכווצות גדולה מדי.

קיימות שיטות שונות לבחירת הנבאים שייכנסו לרגרסיה: enter, forward, backward, stepwise

  הוא מדד להתכווצות המתאם עליו דנו בשיעור הקודם.

► חזור                    המשך ◄