יחידה 7: מתאם  >>  7.4: נושאים נוספים

חשוב לזכור!  מתאם מעיד על קשר ולא על סיבתיות.

 

במידה ונמצא מתאם בין שני משתנים ניתן לדבר על קשר בין המשתנים, אך לא על סיבתיות ביניהם (דוגמה: מותר לומר שקיים קשר בין לחץ ותוקפנות אך לא ניתן לומר שמידת הלחץ משפיעה על מידת התוקפנות, או ההיפך).

 

במידה ולא נמצא מתאם בין שני משתנים, ייתכן ולא קיים קשר ביניהם בכלל או ייתכן וקיים קשר לא לינארי:

 

תנאי הכרחי למתאם הוא שונות.

 

 ניתן לראות זאת מהנוסחה:

 

אם לאחד משני המשתנים אין שונות (סטיית תקן), בחישוב המתאם אנו מחלקים באפס ואז המתאם אינו מוגדר.

יש לכך גם הסבר לוגי משום שאם נבקש לבדוק בקרב תושבי תל אביב את הקשר בין עיר מגורים להכנסה הרי שלא נוכל לבצע זאת משום שמשתנה המגורים הינו קבוע. כלומר, לא ניתן לבדוק קשר בין משתנה לקבוע וכמובן שלא בין שני קבועים.

אם השונות מאד קטנה, סביר להניח שבמקרה הטוב נמצא מתאם נמוך. זאת משום שאמנם במכנה נציב ערך נמוך, אך הפיזור הנמוך במשתנה ישפיע על ה-cov אף יותר.
לכן, תנאי הכרחי לקיום מתאם הוא שונות!

 

הערה: במקרים מסוימים ניתן למצוא מתאם גבוה אפילו אם השונות קטנה.

קיצוץ תחום: מצב שבו "מסננים" את הנבדקים ע"פ לפחות אחד משני המשתנים.

במצב כזה, חוסר הקשר שבין המשתנים במדגם אינו מעיד על חוסר קשר באוכלוסייה, מאחר שע"י הקיצוץ "נפגעת" השונות של לפחות אחד מהמשתנים.

לדוגמא: בקרב סטודנטים לרפואה לא קיים קשר בין ציוני הבגרות בביולוגיה לבין רמת ההצלחה בלימודי הרפואה. למה? משום שהתקבלו לרפואה רק הסטודנטים הטובים ביותר ובקרבם אין כמעט שונות בציוני הביולוגיה, לעומת ציוני הרפואה, בהם קיימת שונות. לעומת זאת אם היו מתקבלים לרפואה גם סטודנטים עם ציונים נמוכים בביולוגיה, היינו מצפים לקבל מתאם חיובי בין ציוני הבגרות בביולוגיה לבין הציונים ברפואה.

איזה ציון בגרות כן יכול לנבא את הצלחתם ברפואה? באופן מפתיע.... תנ"ך.

למה? משום שבציוני הבגרות בתנ"ך קיימת שונות גדולה בקרב התלמידים שהתקבלו לרפואה, וסביר להניח שיכולת ההצלחה בבגרויות בכלל, ובתנ"ך בפרט, קשורה ביכולת ההצלחה בלימודי הרפואה. מכאן שנוכל לקבל מתאם גדול יחסית.

הערות:

כאשר קיים קשר לינארי בין x ל-y לאורך כל הטווח, צפוי שקיצוץ התחום יפגע במתאם.

קיצוץ תחום לא יפגע במתאם כאשר קיים קשר לינארי מושלם והמתאם הוא 1 או 1-.

 

קיצוץ תחום במקרה שקיים קשר לא לינארי, ריבועי לדוגמה, דווקא יכול להעלות את המתאם משום שבודקים רק את אחד מצדדיה של העקומה ואז ניתן למצוא מתאם גבוה, לעומת בדיקת הקשר על פני כל העקומה שם לא היינו מוצאים קשר לינארי.

 

במדעי החברה מקדם המתאם נע לרוב בטווח 0.3-0.6.

טרנספורמציות לינאריות

 

טרנספורמציות לינאריות אינן משפיעות על המתאם.

 

אם נמצא שהמתאם בין x  ל-y הוא  וידוע ש: , אזי .

 

הוכחה:

תזכורת: אם מכפילים כל ערך בקבוע (a) ומוסיפים לו קבוע (b), הרי שהממוצע מוכפל בקבוע (a) ומתווסף לו הקבוע (b), וסטיית התקן מוכפלת בקבוע (a).

 

לכן, מאחר ו-w הוא טרנספורמציה לינארית של x, ציון התקן של w יהיה זהה לציון התקן של x:

הקשר בין x לבין y שווה לקשר שבין w ל-y.

 

הנוסחא המקורית של המתאם מנוסחת בצורה של ציוני תקן. כזכור, ציוני תקן אינם מושפעים מטרנספורמציה לינארית (לפני ההמרה לציוני תקן) ולכן גם המתאם אינו מושפע מטרנספורמציות לינאריות.

אם נכפיל את אחד המשתנים בקבוע שלילי הקשר יתהפך אך בעצם גם שינינו את המשמעות התיאורטית של אחד המשתנים (לדוגמה, מעבר מאושר לחוסר אושר =עצב). מה שחשוב הוא שעוצמתו של המתאם אינה משתנה!

► חזור                    המשך ◄