שאלות נפוצות - מתאם

לקורס המקוון

 

לדף הראשי

1. שאלה:

(חישוב פי)
עברתי על השאלות לדוגמא של מתאמים, והייתה שם שאלה שבה נתבקשנו לחשב פי. בתשובות עשו זאת באמצעות חישוב חי בריבוע, ובגלל שלא התקיימה ההנחה של ערך צפוי >= 5 בלפחות 80% מהתאים, נאמר שלא ניתן לחשב חי בריבוע, ובהתאמה - לא ניתן לחשב פי.
אבל אם משתמשים בדרך הישירה לחישוב פי (הצבת 0 ו-1 במקום הערכים השמיים), כיצד אפשר לדעת שההנחה הזו לא מתקיימת?

 

פתרון:

אמנם למדנו שניתן לחשב את פי באמצעות נוסחת המתאם (וזאת ע"מ להבין שכל המתאמים מבוססים על אותו העיקרון). בפועל, לכל מקדם מתאם יש את ההנחות שלו אשר צריכות להתקיים. לגבי פי ההנחות הן אותן ההנחות של חי בריבוע. בעצם, הדרך הנוחה ביותר לחשב את פי היא מתוך חי בריבוע ועל כן אין סיבה מעשית לנהוג אחרת כאשר מחשבים ידנית. התכנות הסטטיסטיות נותנות מענה בכך שמדווחות על אחוז התאים בעלי שכיחות צפויה קטנה מ-5.

 

2. שאלה:

(טרנספורמציית פישר)
האם משתמשים בטרנס' פישר בכל בדיקת השערות מתאם? או רק כאשר ההשערה היא אינה roh=0?
ובחישוב רב"ס בכל מקרה עושים את הטרנספורמציה, נכון?

 

פתרון:

רק כאשר רו שונה מ-0 יש צורך בביצוע הטרנספורמציה לכן לא מקובל לעשות אותה כאשר רו=0.

ניתן לבנות רב"ס על סמך התפלגות t. הסטטיסטי הוא r, וסטיית התקן היא sqrt(1-r^2)/(n-2(

 

3. שאלה:

(אחוז שונות מוסברת ממתאם חלקי)
בשאלה 2 בשאלות לדוגמה.
האם יש אפשרות להוציא את אחוז השונות המוסברת ע"י מציאת המתאם החלקי (החלק של צפייה בטלוויזיה בניכוי הגיל) ולהעלות בריבוע כדי למצוא אחוז שונות מוסברת? נראה לי שלא אבל אין לי מושג למה.

 

פתרון:

המתאם החלקי מאפשר לנו לבחון את המתאם בין שני משתנים (נאמר y ו-x1) בניכוי של משתנה שלישי (x2). נוסחת המתאם החלקי מאפשרת, בעצם, לנטרל את השונות של המשתנה המנוכה (x2) משונות שני המשתנים האחרים. ובמילים אחרות, ריבוע המתאם החלקי "מספר" לנו על הפרופורציה של השונות המוסברת של y עפ"י x1 בניכוי x2, מתוך כלל השונות של y ו-x1 אשר אינה מוסברת ע"י x2. או בקיצור, התשובה היא כן: מתאם חלקי בריבוע ייתן לנו את אחוז השונות של y ע"י x1 המנוכה מהשפעת x2.

 

4. שאלה:

(מתאם מרובה וחלקי)
בשיעור החזרה ריקרדו אמר שמשתנה חדש אינו יכול לגרוע מהניבוי.
אבל לפי הבנתי, זה בדיוק מה שמשתנה מדכא עושה, כאשר ניקח אותו בחשבון נקבל מתאם נמוך מאשר המתאם המנוכה ממנו. האם לא יכול להיות מצב שבו נוסיף נבאי וקבל מתאם נמוך יותר? כנראה שהתבלבלתי איפשהו, אשמח להבהרות.

 

פתרון:

אכן, כאשר ניקח בחשבון משתנה מדכא, הקשר בין שני המשתנים האחרים ירד. אך זו אינה הפרוצדורה במתאם מרובה! אנחנו לא מנכים חלקים שמוסברים ע"י המנבאים, אלא רק בודקים אם יש תוספת לניבוי, ולכן אין אפשרות שהוספת משתנה תקטין את השונות המוסברת.

 

5. שאלה:

(מתאם עפ"י מבחן חי וקיצוץ תחום)
בשאלות רבות, כבר ברמת הנתונים ברור שיש מתאם מושלם בין המשתנים, אך כאשר נחשב חי בריבוע עם תיקון לרציפות יתקבל מתאם נמוך יותר (למשל- 0.97). אילו מהתשובות יותר נכונה? (ולמה זה קורה?)

ועוד אחת- במבחן שפורסם (מועד א', שאלה 2 בחלק הסגור) יש סיטואציה של קיצוץ תחום- החוקר משתמש רק בחצי ממספר הנבדקים, אלו שערכי ה-X שלהם גבוהים.לא ברור לי איך ניתן להסיק האם הקיצוץ יעלה או יוריד את המתאם. האם יש איזשהו עיקרון לפיו ניתן לקבוע? אם אני לא טועה, כאשר מדובר במתאם מושלם אז קיצוץ התחום לא פוגע במתאם, אך מה כאשר לא ידוע לי גודל המתאם?

 

פתרון:

היי אני אנסה להסביר איך שאני מבינה אולי זה יעזור....
קיצוץ תחום אומר בעצם שאנחנו מקצצים בשונות!! ברגע שאנחנו מקצצים בשונות אז סביר להניח שהמתאם שיצא יהיה יותר קטן. הרי התנאי לצורך חישוב מתאם הוא שונות, כי ברגע שאין שונות, גם לפי הנוסחה של המתאם זה יוצא לא מוגדר,ובנוסף אם למשל כולם באותו גובה ורוצים לבדוק את הקשר בין גובה לידע ,אין מה לדבר על קשר כי כולם עם אותו ערך לא נוכל לדעת אם גובה שונה קשור לידע שונה. ברגע שמקצצים תחום, אנחנו מורדים מן השונות ופוגעים במתאם- ז"א, ביכולת למצוא קשר בין שני המשתנים. בכלל אם לא הייתה שונות לא היינו צריכים את הסטטיסטיקה כי הכל היה יותר ברור....
אם המתאם מושלם קיצוץ התחום לא יביא לפגיעה במתאם . דבר נוסף,מדובר פה רק על קשר ליניארי. בקשר מונוטוני זה הפוך-קיצוץ תחום יביא למתאם יותר גבוה.


(ריקרדו עונה):
לגבי חי בריבוע, התיקון לרציפות אכן גורם לכך שהמתאם המקסימאלי האפשרי יהיה קטן מ-1. לכן כאשר המתאם מאד גבוה התיקון "מקלקל" אבל בשאר המצבים, התיקון משקף טוב יותר את הקשר באוכלוסייה. מאחר ובפועל במדעי החברה ברוב המקרים המתאמים לא מאד גבוהים, התיקון לרב פועל לטובה.
לגבי קיצוץ התחום כפי שנאמר בכיתה:
כאשר המתאם ליניארי אך לא גבוה באופן קיצוני, קיצוץ התחום יגרום לירידה במתאם (זהו המצב הנפוץ ביותר).
אם המתאם מושלם אז קיצוץ תחום לא יגרום לשינוי.
אם הקשר, לדוגמא, ריבועי קיצוץ תחום יכול לגרום לעלייה במתאם.
מכאן שברב המקרים קיצוץ תחום יגרום לירידה במתאם, אך אם זאת הוא יכול גם לגרום לעליה.

 

6. שאלה:

(טרנספורמציות והתכווצות מתאם)
מה קורה ל-'Y כאשר מכפילים את כל ערכי ה-X בערך כלשהו?
אם אני לא טועה, כאשר מוסיפים לכל ערכי ה-X ערך כלשהו, אין שינוי בניבוי שכן הטרנספורמציה לא משפיעה על השונויות ושאר הערכים מתקזזים. אבל מה קורה כאשר הטרנספורמציה היא כפל והשונות של X משתנה? (האם יש חוקיות כלשהי בשינוי?)

מבחינת תופעת התכווצות המתאם- האם היא מתרחשת גם בקשר מושלם או כאשר r=0?

 

פתרון:

גם ההכפלה בקבוע מתקזזת. תציבי בנוסחה הבסיסית המופיעה בשקף 6 במצגת 9. אמנם סטיית התקן מוכפלת בקבוע אך גם x וגם ממוצע x. ובאופן תיאורטי, שינוי כלשהו בערכי x לא משפיע על ערכי y. אם לדוגמא מדובר על הקשר שבין לחץ לגובה, אם הלחץ של כולם הוכפל, זה לא אמור להשפיע על ערכי הגובה.

תופעת ההתכווצות רלוונטית גם כאשר המתאם שווה ל-1 (כי ייתכן שהמתאם של 1 במדגם לא מייצג מתאם של 1 באוכלוסייה). אם המתאם במדגם שווה ל-0, אז הוא לא יכול להתכווץ, לאן?

 

7. שאלה:

(שימוש במחשבון)
איך אפשר לעשות מתאמים במחשבון דיונון סטנדרטי ! ? ! ? !

 

פתרון:
בהנחה שיש לך את המחשבון שיש לי (fx-82MS, מה שזה לא אומר..) הנה ההסבר:
קודם כל מאפסים את הN על ידי:
Shift --> Mode ---> 1
ולוחצים =.
אחרי זה מעבירים את המחשבון ל-mode 3 (רגרסיה) ואז לוחצים 1 (ליניארי)
אחרי זה מזינים את הערכים, כשקודם מזינים את ה-X ואז את ה-Y וביניהם פסיק. אחרי כל זוג, למשל : 22,50 לוחצים על הלחצן M+.
זה יראה לך את ה-N אחרי כל הזנה.
לבסוף אחרי הזנת כל הערכים אתה לוחץ Shift 2
מכאן אתה פשוט מטייל עם החצים ומוצא את מה שאתה צריך. שתי לחיצות עם החץ לצד ימין ולחיצה על הספרה 3 יתנו לך את המתאם. בנוסף יש לך את האפשרות לדעת את סטיות התקן, האומדנים והממוצעים של שני המשתנים.
מקווה שזה היה ברור, עשיתי את מיטב יכולתי
ולא לשכוח כל פעם לאפס את ה-N..


* הלחצן RCL ואחריו C (באדום) יראה לך את מצב ה-N הקיים.

 

8. שאלה:

(פירסון וספירמן)
עבור אותם נתונים, האם כאשר מתאם פירסון שווה 1 אז גם מתאם ספירמן בהכרח שווה 1?

 

פתרון:

כן, הם עובדים על אותה נוסחא, אבל ההפך לא נכון!
ספירמן עובד על תכונת הסדר ולעומתו, פירסון על רווח. יתכן שיהיו מסודרים בסדר עולה אך לא עם אותם מרווחים (לא יתכן מצב הפוך)

 

9. שאלה:

(רב"ס למתאם בדף נוסחאות)
האם נוסחת הרב"ס למתאם לא מופיעה בדף הנוסחאות? זאת עם הטרנספורמציות וכו'?...

 

פתרון:

נכון, נוסחת רב"ס למתאם באוכלוסייה לא מופיעה בדף הנוסחאות , אבל יש נוסחת רב"ס כללית, צריך כל פעם לשנות אותה ולהתאים את- הסטטיסטי, דרגות החופש, האומדן לסטיית התקן.
בחישוב רב"ס למתאם, הפרמטר הוא רו תג (מה שמחפשים טווח סביבו), הסטטיסטי הוא r' - (מה שמציבים ראשון) לפי המתאם במדגם אחרי שעבר טרנספורמציית פישר. נשתמש ב Z של אלפא חצי (כי עברנו להתפלגות נורמלית) ונכפיל בס"ת שהיא 1 חלקי שורש (n-3)

ותשאלו- איך נזכור את זה אם זה לא בדף נוסחאות?
אהה! יש נוסחא ל Z מתאם שעבר נירמול (תחת "מובהקות מתאם") ממנה ניתן להסיק שסיגמה היא הביטוי במכנה.

לעומת זאת, במבחן מועד ב' תשס"ד נעשה שימוש ברב"ס לפי התפלגות t (אל תשאלו אותי למה). אז הפרמטר- רו, הסטטיסטי- r , משתמשים ב t של אלפא חצי עם n-2 דרגות חופש, והסיגמה היא- (שורש (1 פחות r בריבוע) חלקי (n-2)) שזה הופכי למה שמכפילים את r בנוסחא של מובהקות מתאם לפי t ההיגיון נשאר אותו היגיון, רק יותר מבלבל.

 

10. שאלה:

(מבחן t וחישוב rpb)
האם יתכן מצב בו אין הבדל מובהק לפי מבחן t (במבחן t לא דחינו את Ho) , אבל יש קורלציה מובהקת? (או במילים אחרות: תש"ס א' שאלה 2 סעיף אחרון.)

 

פתרון:

מתאם rpb מבוסס על t לבלתי תלויים- ורק אם ה-t מובהק המתאם מובהק.
בשאלה הנ"ל, מדובר על מבחן t לתלויים, ויכולה להיות קורלציה (ואפילו מאוד סביר שיהיה) בין הלפני לאחרי כי מדובר באותם אנשים שעברו שינוי.
(בתכל'ס לא נראה לי שאמורים לעשות מתאם לאותו משתנה באותו נבדק, אלא רק בשני משתנים שונים).

 

11. שאלה:

(חישוב rpb ובדיקת שיווין שונויות)
האם גם כאשר בודקים rpb במדגם צריך לעשות בדיקת שוויון שונויות?
ובכלל, מה עושים לגבי rpb כאשר הנחת שוויון השונויות לא מתקיימת?

 

פתרון:

חישוב ה-rpb אמור לבוא לאחר שכבר ביצענו מבחן t לב"ת לשונויות שוות, ולכן בשלב זה כבר ראינו שהשונויות שוות.
אם השונויות לא שוות, נוכל לבצע t לב"ת לשונוית לא שוות, אך לא נחשב rpb במדגם זה (למרות שטכנית ניתן וההבדלים בין תוצאות שני סוגי ה-t לב"ת הם קטנים).

 

12. שאלה:

(חישוב rpb)
לא ברור לי איך מחשבים את מתאם rpb לפי מבחן t לבלתי תלויים. מתאם rpb הוא כשיש משתנה אחד שמי דיכוטומי והשני בסולם רווח/יחס. במבחן t לבלתי תלויים אמורים לחשב ממוצע של כל אחד מהמשתנים ואת האומדן לסטיית התקן, אבל אי אפשר לחשב את זה כשהמשתנה הוא שמי, אז איך כן מחשבים את מתאם rpb באמצעות מבחן t לב"ת?

 

פתרון:

ב-t לב"ת, הממוצע וס"ת מחושבים עבור המשתנה שבסולם רווח/יחס. ערכי המשתנה השמי הדיכוטומי באים לידי ביטוי כשתי הקבוצות השונות במבחן ה-t. אם נבדוק אם יש הבדל בגובה (סולם יחס) בין גברים לנשים (שמי), נשווה את ממוצע הגבהים עבור כל אחת מקבוצות המשתנה השמי (1. גברים, 2. נשים).
מתאם rpb מבטא את הקשר בין הערך השמי הראשון (גברים) ואיזשהו ערך במשתנה הגובה (נגיד 1.75 מטר), ובין הערך השמי השני (נשים) ואיזשהו ערך בגובה (נגיד 1.65). ככל ששונות גבהי הגברים במדגם קטנה יותר, הם יהיו מקובצים יותר סביב 1.75, וכנ"ל לגבי הנשים ו-1.65. במקרה זה, ערך ה-t יהיה גדול יותר (ההבדלים בין הקבוצות גדולים יותר), ובהתאם ה-rpb יהיה גדול יותר (גברים קשורים טוב יותר לערך 1.75 ונשים לערך 1.65).

כדי למנוע בלבול: בניגוד לפירסון/ספירמן, לא מדובר פה במתאם המתואר כאיזשהו קו הנמשך לאורך צירי ה-x וה-y, אלא שני מקבצי נקודות התואמים את שני ערכי המשתנה השמי. לחצו כאן לדוגמא גרפית.

 

13. שאלה:

(הנחות לחישוב מתאם)
אחת מההנחות לבדיקת מובהקות מתאם פירסון וספירמן היא שהתפלגות הדגימה של המתאמים מתפלגת t בקירוב.
האם זוהי הנחה שאנחנו פשוט מניחים או שעלינו לבדוק אותה בפועל (n1,n2>30/משתנים מקוריים מתפלגים נורמלית באוכלוסייה)?

 

פתרון:

אני לא יודע מה העמדה הרשמית של המתרגלים וריקרדו, אבל בשאלות שאנחנו פותרים במטלות ובתירגולים אנחנו פשוט מניחים, בלי לבדוק. בדרך כלל ממש אין מדגם מספיק גדול וגם לא נאמר במפורש שום דבר על התפלגות האוכלוסייה, ובכל זאת אנחנו בודקים מובהקות בלי שום ייסורי מצפון! אני מניח שזה נובע מטוב ליבם של אנשי הצוות, שחוסכים מאיתנו לחשב מתאמים, שונויות וכו' למדגמים של 50...

לגבי שיווין שונויות- גם שם אנחנו נתקלים לפעמים בבעיה שצריך לעשות מבחן F, וגם לו יש הנחות די חזקות. צריך לוודא שהכל מתפלג t וכו'... לכן ייתכן שגם שם הם מתכוונים, כשמדובר במתאמים ורגרסיות, לוותר על בדיקת כל ההנחות. תחשבו כמה לא נעים זה יהיה לחשב שונויות ל- 30 תצפיות ואז- במקרה הטוב- יש שיווין שונויות, ונוכל להתחיל לחשב מתאמים לכל אותן 30 תצפיות...
הכי טוב יהיה אם נוכל לקבל בשאלה משפט קטן כמו "ידוע שבאוכלוסיה X מתפלג נורמאלית", או משהו כזה...

 

14. שאלה:

(מבחן F)
האם כיוון ההשערה במבחן F (לבדיקת שוויון שוניות ולבדיקת מובהקות למתאם מרובה), תמיד יהיה דו צדדי?

 

פתרון:

בעיקרון, כן.
במבחן לבדיקת שיווין שונויות אין שום סיבה להניח שאחת השונויות דווקא גדולה מהשנייה. כמובן שיכול להתעורר מצב כזה, אבל מבחינתנו, אם כבר ידענו שאחת גדולה מהשנייה מראש לא היינו עושים את המבחן, כי אנחנו רק מעוניינים לבדוק האם הן שוות או לא, כדי להחליט איזה מבחן t לעשות.
במבחן למובהקות מתאם זה פחות חד משמעי. אם כבר יש לך השערה שקיים מתאם, נניח חלש, ואת רוצה להראות שבאוכלוסייה שלך יש מתאם יותר גדול, אז יש מקום לבדיקה חד צדדית.
אבל- אם אני לא טועה, כדי לחשב מובהקות כשהשערת ה- 0 היא לא שהמתאם הוא 0, צריך לזכור להשתמש בתיקון פישר!

 

15. שאלה:

(קו רגרסיה ומבחן F)
האם ניתן לחשב קו רגרסיה גם כאשר המתאם אינו מובהק? זה נכון לעשות זאת?

מדוע בראש טבלת F רשום שאלפא שווה ל-0.025? זה לא אמור לתת לנו אלפא של 0.05? ובהקשר זה - השרטוט של התפלגות F מראה את כל אלפא בצד אחד. האם זה כמו חי-בריבוע (כל האלפא בצד אחד) או שזה רק לשם הנוחות ויש חצי אלפא בכל צד?

 

פתרון:

זה לא נכון לחשב קו רגרסיה כאשר המתאם אינו מובהק. נראה לי שנאמר על כך בשיעור לציין שאנו מודעים לכך, ולמרות זאת להעלים עין ולחשב...

הטבלה מתייחסת למצב שבו השונות הגדולה נמצאת במונה. לכן הדחייה היא רק בזנב העליון. ו-0.025 ח"צ זה כמו 0.05 דו"צ.
עבור מבחן F למובהקות מתאם נוכל לבדוק רק השערות על אלפא של 0.05, מכיוון שהטבלה שבידינו היא ספציפית לאלפא זו במבחן דו"צ.

 

16. שאלה:

(שונויות ברגרסיה)
הייתה שאלה במטלה הלפני אחרונה :

ככל ששונות הטעות בניבוי x1 את x2 גדולה יותר, כך שונות הטעות בניבוי x1 ו-x2 את y קטנה יותר.
מה ניתן לומר על אמירה זו?
א. נכונה תמיד
ב. לא נכונה
ג. לא תמיד נכונה

לא הצלחתי להבין למה זה לא תמיד נכון (אלא אם כן זה בגלל האפשרות שאין בכלל מתאם בין x1 ו x2 לבין y).

 

פתרון:

שונות הטעות של ניבוי Y באמצעות x1ו-x2 תלויה גם במתאם ביניהם, זה נכון- אבל גם במתאם בין כל אחד מהם ל-y. לכן, שינוי באחד מהם, לא יכול להצביע על תופעה שתמיד נכונה, כי לא יודעים מה קורה עם המתאם בין Y למנבאים, שכמובן משפיע (ואת צודקת, אחד המקרים יכול להיות שאין מתאם בכלל בינם לבין y).
אפשר לראות את זה בקלות דרך הנוסחאות:
שונות הטעויות היא אחת פחות r בריבוע, כלומר- ככל שהיא גדלה, r קטן וככל שהיא קטנה r גדל. (זה מסביר את החלק הראשון של השאלה: מה שקורה כאשר שונות הטעויות גדלה- זה שהמתאם קטן בין x1 ל- x2).
לחצי השני של השאלה:
לפי הנוסחה של R, הוא תלוי בכל המתאמים: במתאם בין x1 ל-x2 (שלפי החצי הראשון קטן- אז בעצם R גדל, ושונות הטעויות של המתאם המרובה קטנה), אבל גם במתאמים בין y ל-x1 ובין y ל-x2- שאין לנו מושג מה קורה איתם, אם הם בכלל קיימים, או שאולי אחד מהם שווה לאחד, או לא יודעת... ואז, אם אנחנו לא יודעים מה קורה ל-R, לא נדע גם מה שלום שונות הטעויות שלו. נכון- סביר שהיא תקטן, אבל אי אפשר לדעת- לכן זה לא תמיד נכון.

 

17. שאלה:

(טרנספורמציית פישר)
אם יש לי מתאם שלילי אני מעבירה גם את הסימן (-) או שהכל הופך לחיובי?
אז אם יש לי r= -0.4 הפישר שלו זה 0.424 או 0.424-?

 

פתרון:

צריך למצוא את ערך הפישר של הערך המוחלט של המתאם, ואז להתאים סימן בהתאם (מינוס אם המתאם המקורי היה שלילי, פלוס אחרת).
שימי לב שהנוסחא לחישוב פישר (היא לא בדף הנוסחאות, וחבל. היא מופיעה במצגת) תיתן לך עבור שני rים עם סימן הפוך בדיוק ערך פישר זהה, רק עם סימן הפוך.

0.424-

 

18. שאלה:

(מובהקות מתאם ורגרסיה)
אם המתאם לא מובהק- מותר לחשב רגרסיה?
זה נוגד את ההנחה הראשונה של רגרסיה, אך ראיתי שעשו את זה במבחנים (גם לגבי המתאם וגם לגבי האוכלוסייה).
אם אפשר- מתי ההנחה על רגרסיה תקפה ואסור לחשב?

 

פתרון:

בשאלות חישוביות על רגרסיה ניתן יהיה להניח שקיים מתאם מובהק.

 

19. שאלה:

(רב"ס למתאם)
לגבי העניין של חישוב רב"ס למתאם באוכלוסיה ברמת בטחון. מישהו יכול להסביר למה חשוב לעשות את התיקון לפישר? ברור שאם עושים רב"ס לפי Z התיקון נחוץ, אבל אם עושים אותו לפי t זה גם אמור להיות בסדר, לא ? הרי מבחן t לוקח בחשבון שיש באמת הטיה מסוימת. ואם הוא מספיק טוב בשביל לבדוק מובהקות למה הוא לא מספיק טוב בשביל לבנות רב"ס.  אני לא יודע למה, אבל ההסבר על זה שהמתאם ברב"ס לא ייפול על ה-0 לא מצליח לשכנע אותי בדיוק, כי גם עם תיקון פישר הוא יכול ליפול על ה-0, לא?

 

פתרון:

אם השערת האפס אומרת שהמתאם באוכלוסייה שווה לאפס, התפלגות הדגימה של המתאמים תתפלג t (ובין היתר תהיה סימטרית סביב 0), ונוכל לחשב בכיף ערך t. אם ההשערה אומרת שהמתאם שווה לערך שהוא לא אפס, ההתפלגות כבר לא תהיה סימטרית, ולא תהיה לנו דרך לבדוק מה ההסתברות לקבלת מתאם כלשהו. אז נעשה תיקון פישר, והתפלגות הדגימה של המתאמים תהיה נורמלית בקירוב. לכן, כשבונים רב"ס, אנחנו מניחים שאנחנו בונים רב"ס סביב ערך שונה מאפס (אחרת אין מתאם באוכלוסייה ואין למה למצוא רב"ס), ולכן צריך תיקון פישר. לכן גם t "מספיק טוב למובהקות" עבור השערת אפס סביב אפס, אך נצטרך פישר ו-Z עבור כל מה שלא סביב אפס.

 

20. שאלה:

(מובהקות מתאם ורגרסיה)
מה המשמעות של חישוב מתאם, רב"ס ונוסחת רגרסיה אם לא מצאנו מובהקות (ב-t, בחי בריבוע או בכל מבחן אחר). הרי אי אפשר להגיד שיש מתאם (גם במדגם) אם אין מובהקות (או שזה תקף רק לגבי השערה על האוכלוסייה). ובטח שאי אפשר לבנות רב"ס אם אין מתאם מובהק במדגם שמשליך על האוכלוסייה. ואותו הדבר צריך להיות לגבי נוסחת רגרסיה. אמנם בפועל אפשר להציב ולבנות אותה, אבל איזה מין משמעות תהיה לה ללא מתאם מובהק?

 

פתרון:

אם אין קשר מובהק, לא דחינו את השערת האפס, ומבחינתנו המתאם באוכלוסייה הוא מה שהשערת האפס אומרת (0 לרוב). מכיוון שלא דחינו את השערת האפס, אין לנו סיבה לחשוב שהמתאם באוכלוסיה שונה מהשערת האפס, ואין סיבה להעריך אותו.