יחידה 8: מתאם  >> 8.1:  הטרנספורמציה של פישר

הטרנספורמציה של פישר

בשבוע שעבר למדנו לבצע בדיקת השערות עבור r כאשר .  ראינו גם שהתפלגות הדגימה הינה סימטרית סביב האפס ומתפלגת בקירוב t:

אבל מה קורה כאשר ?

לדוגמא, אנחנו יכולים לשאול האם ייתכן והמדגם לקוח מאוכלוסיה שבה המתאם שווה 0.8.

 

אם אנחנו מניחים שהמדגם לקוח מאוכלוסיה שבה המתאם שונה מאפס התפלגות הדגימה תהיה מוטה ולכן כבר לא תתפלג t. הסיבה להטיה זו נובעת מהעובדה שבאופן טבעי למתאמי המדגמים נטייה להתפזר באופן "סימטרי" סביב המתאם שבאוכלוסיה, אך בפועל הדבר בלתי אפשרי משום שטווח המתאם  נע בין 1- ל 1. לכן, כאשר המתאם באוכלוסייה שונה מ-0, הפיזור של מתאמי המדגמים לא יוכל להיות סימטרי סביב מתאם האוכלוסיה מאחר וטווח הערכים האפשריים מצידו האחד שונה מטווח הערכים מצידו השני. עקב עובדה זו, ככל ש-  שונה יותר מאפס כך ההתפלגות מוטה יותר.

 

לדוגמא, אם המתאם באוכלוסייה שווה ל-0.8, טווח מתאמי המדגמים האפשרי בצד אחד הוא
1.8 (בין
-1 לבין 0.8) ואילו בצד השני 0.2 (בין 0.8 לבין 1).

 

בכדי להתמודד עם מקרים אלו של התפלגות דגימה מוטה במקרה של השערת אפס על מתאם באוכלוסיה השונה מאפס, פותח תיקון פישר אשר "מנרמל" את ההתפלגות.

תיקון פישר (Fisher) הוא טרנספורמציה לא לינארית המתבצעת על ערכי r של ההתפלגות עצמה (היא אינה מתבצעת על ערכי x ו-y עצמם אלא על המתאם לאחר שחושב). הטרנספורמציה (המסומנת r') הינה לוגריתמית וככזו משפיעה יותר על הערכים הקיצוניים. לאחר הטרנספורמציה ההתפלגות תהיה בקירוב נורמלית.

זוהי טרנספורמציית פישר: .

 

מאחר ואנו לא נרצה לבצע חישוב מורכב זה, קיימות שתי אופציות לביצוע הטרנספורמציה:

1. טבלה הממירה ערכי r לערכי r'. (להורדת הטבלה לחץ כאן)

2. באמצעות EXCEL על ידי הנוסחה =FISHER(r)

לאחר הטרנספורמציה, ערכי ה-  יתפלגו בקירוב נורמלית עם הפרמטרים .  

במבחן לבדיקת מובהקות המתאם נציב את ערך המתאם במדגם שעבר טרנספורמציה  ואת ערך המתאם באוכלוסיה שעבר טרנספורמציה  בתוך נוסחת Z.

להלן נוסחת המבחן:   .

דוגמא:

באוכלוסייה ידוע שהמתאם בין מספר הקשרים החברתיים (מספר האנשים איתם מדברים לפחות פעם בחודש) לבין תפקוד המערכת החיסונית (לפי מדדים פיזיולוגיים) הנו  .

חוקרת רצתה לדעת האם מתאם זה גבוה יותר בקרב אנשים בעלי מיקוד שליטה חיצוני. במדגם של 30 אנשים בעלי מוקד שליטה חיצוני היא מצאה .

 

א) האם ניתן לומר ברמת בטחון של 95% כי המתאם בקרב בעלי מוקד שליטה חיצוני גבוה יותר מאשר בכלל האוכלוסייה?

 

פתרון:

 

 

לצורך הפתרון ממירים את ה-r של המדגם ואת ה-  ל-r' ול-  לפי טבלת פישר, או לחלופין לפי EXCEL באמצעות הפקודה FISHER():

 

EXCEL: =FISHER(r)=FISHER(0.6)=0.693

= FISHER(0.3)=0.31

 

 

ומציבים את התוצאות בנוסחת Z:

 

מעתה נוהגים עם ערך Z שהתקבל כפי שנהגנו בעבר עם ערכי Z. ניתן להשוות את Z ל-  (שהוא במקרה זה 1.645) או להשוות את ה-p-value (של Z=1.99) לאלפא.

 

 

Z=1.99, p<.05 לכן ניתן לדחות את  ולומר שהמדגם לקוח מאוכלוסיה שבה המתאם גדול מ-0.3.

 

ב) ברמת בטחון של 95%, מהו המתאם באוכלוסייה בעלי מוקד שליטה חיצוני?

 

פתרון:

 

זוהי שאלה על רווח בר סמך. קיבלנו מתאם במדגם ורוצים לדעת ברמת בטחון מסוימת מהו המתאם באוכלוסיה.

הרווח בר סמך (שבאופן גנרי בנוי תמיד כך : סטטיסטי המדגם  z או t, כפול סטיית התקן של התפלגות הדגימה) יראה הפעם כך: . דהיינו r פישר של המדגם כפול z ( המתאים
ל-
  כפול סטיית התקן של התפלגות הדגימה של r פישר .

 

 

בשלב זה "חוזרים למונחים של  ע"י הנוסחה ההופכית =FISHERINV(r’)

FISHERINV(0.316)=0.306)), או לחלופין חיפוש בגוף הטבלה את ערכי ה-r' ומציאת ערכי ה-r המתאימים להם.

 

 

בדוגמא שלעיל מאחר ורווח זה גדול יחסית, רצוי שנגדיל את גודל המדגם על מנת להקטינו.

► חזור                    המשך ◄