יחידה 8: מתאם  >> 8.3:  מתאם ספירמן

מתאם ספירמן -  Spearman rank correlation coefficient

מתאם פירסון מתאים למצבים בהם מתקיים:

·         סולם המדידה של המשתנים רווח/יחס

·         הקשר לינארי

נבחר במתאם ספירמן במידה וסולם המדידה של לפחות אחד המשתנים הנו סדר, או לחלופין הקשר לא לינארי אך מונוטוני.

במקרה של קשר מונוטוני שאינו לינארי, נעדיף להשתמש במתאם ספירמן ולא פירסון, משום שהמתאם שנקבל יהיה גבוה יותר, דבר אשר ישקף בצורה נכונה יותר את המציאות.

 

מתאם ספירמן מבוסס על תכונת הסדר של המספרים. הוא בוחן האם ככל ש-x גדל, כך גםy  גדל, אך אין חשיבות לעובדה בכמה כל אחד מהמשתנים גדל. זאת בדומה למבחנים הא-פרמטרים שם השתמשנו בתכונת הסדר של המספרים באמצעות הדירוגים שלהם.

 

בחישוב מתאם ספירמן אנו נעבוד עם נוסחת המתאם הכללית של פירסון אך במקום להזין את הערכים עצמם, נזין את הדירוגים שלהם. ניתן לעבוד כך משום שבעצם אנו מחפשים קשר לינארי בין דירוגים.

מקרים בהם הקשר מונוטוני אך :

כאשר אנו לא מתייחסים לכמות שבה x ו-y גדלים, אנו בעצם מתייחסים לקשר בין דירוג הערכים ועל כן מתאם ספירמן מבוסס על דירוגים.

שלבים:

 

1. עלינו לדרג בנפרד את ערכי ה-x ואת ערכי ה-y )הטיפול ב-ties כפי שלמדנו בעבר).

2. את הדירוגים נכניס לנוסחת המתאם.

 

אם קיים קשר מונוטוני בין הערכים  אזי קיים קשר לינארי בין הדירוגים.

 

קיימת נוסחת קיצור (אשר הייתה שימושית בעידן ללא מחשבים), אשר טובה דיה למקרים בהם אין יותר מ-20% ties. רק לצורך השכלתכם הכללית, להלן הנוסחה:  .

 = ההפרש שבין דירוג  לבין דירוג  עבור התצפית ה-i.

 

גם כאשר רק אחד מהמשתנים בסולם סדר ואילו השני בסולם רווח/יחס אנו נדרג את שני המשתנים ונחשב מתאם ספירמן כרגיל.

דוגמא:

להלן נתונים על מידת הלחץ בעבודה ומידת שביעות רצונם מהעבודה של 8 עובדי עיריית ת"א, אשר נדגמו מקרית. האם ניתן לומר ברמת בטחון של 95% שקיים קשר בין המשתנים?

 

פתרון:

 

מדרגים את ערכי x ו-y בנפרד ופותרים את נושא ה-ties כפי שלמדנו. מחשבים את המכפלות שבין הדירוגים. ניתן להזין למחשבון את הדירוגים x ו-y ואז ניתן לקבל את כל הערכים: ממוצעים, סטיות תקן ומכפלת הערכים.

 

הערה: מכיוון שאנו עוסקים בדירוגים, ממוצעי הדירוגים של x ו-y חייבים להיות זהים (כי הם מבוססים על אותו ה-n) אבל סטיות התקן לא בהכרח (כתלות בכמות הקשרים).

 

 

ניתן גם לסכום את ההפרשים בריבוע לפי נוסחת ספירמן:

 

 

הפער בין שני החישובים נובע מה-ties.

אם נזין את נתוני הדירוגים לתוך נוסחת PEARSON ב-Excel נקבל תוצאה זהה.

בדיקת מובהקות

 

קיים תיקון לבדיקת מובהקותו של מתאם ספירמן (קיימת טבלה מיוחדת) אך הפער שבינו לבין בדיקת המובהקות "הרגילה" זניח, לכן אנו נבדוק את מובהקות מתאם ספירמן באמצעות נוסחת t לבדיקת מובהקותו של מתאם פירסון (התיקון משמעותי בעיקר כאשר n<10 ובעולם האמיתי לרוב משתמשים ב-n-ים גדולים יותר בעת חישוב מתאם).

 

 

TDIST(10.63,8,2) = 0.0000054

 

תזכורת: פקודת TDIST מקבלת רק ערכים חיוביים ומכיוון שנמצא לעיל ש: , הרי ש: .

הערה: כפי שכתוב מעלה, השימוש בבדיקת המובהקות של ספירמן דרך מבחן  t טובה רק עבור .

► חזור                    המשך ◄