יחידה 12: בדיקת השערות - המשך  >> 12.4: חישוב עוצמה

חישוב עוצמה

 

כפי שניתן לראות בשרטוט לעיל, עוצמת המבחן הינה אחוז המקרים מתוך התפלגות הדגימה של  בהם דוחים את  בצדק (כי  היא אכן נכונה).

 

על מנת שנוכל לחשב את עוצמת המבחן דרושים:

1. ממוצע האוכלוסייה של

2. ממוצע האוכלוסייה של

3. רמת המובהקות של המבחן

4. גודל המדגם שיילקח במבחן

 

שימו לב: לצורך חישוב עוצמת מבחן אין צורך בממוצע מדגם ספציפי. מכאן נגזר שעוצמת המבחן הינה תכונה של המבחן ותלויה אך ורק בארבעת הגורמים שהוצגו לעיל. פעמים רבות עוצמה מחושבת באופן תיאורטי לפני איסוף הנתונים.

שלבים בחישוב

 

העוצמה מהווה את החלק של התפלגות הדגימה של  הנמצא באזור הדחייה שנקבע ע"י התפלגות הדגימה של   (למרות ש-  אינה נכונה).  אנו, כחוקרים, איננו מודעים לנכונות או אי-הנכונות של ההשערות, וכל שביכולתנו לעשות הוא לקבוע אזור דחייה ביחס ל-  לצורך בדיקת ההשערות.  אם היה ניתן לנו מידע לגבי קיומה ונכונותה של  מסוימת, היינו יכולים לחשב את השטח תחת אותה  הנמצא באזור הדחייה, ובכך לדעת מה ההסתברות שבהינתן ש-  נכונה (כלומר, מדגם שנדגום יבוא מאוכלוסייה זו), אנו כחוקרים גם נדחה את  ונבצע החלטה נכונה.  חישוב זה הוא בעצם חישוב העוצמה.

חישוב העוצמה יתמקד בגבול התוחם את אזור הדחייה, תחילה במונחי ציון תקן ביחס ל- , ולאחר מכן במונחי ציון תקן ביחס ל- .  מכיוון שלא ניתן להעביר ציוני תקן בין שתי התפלגויות, הערך המקשר יהיה הציון הגולמי הנמצא על ציר משותף לשתי ההתפלגויות.

 

מומלץ מאוד לצייר את ההתפלגויות באופן סכמטי לצורך הבנה טובה יותר של המצב הנתון.

 

1. נמצא את ציון התקן הקריטי המתאים לגבול אזור הדחייה של .

 

2. נחשב את הערך הקריטי הגולמי המתאים לציון התקן הקריטי:  (תחת :

 

3. נחשב, תחת , מה ההסתברות להיות "מעבר" ל-  - כלומר מהו  של ה-  (שמצאנו תחת .

 

הנחה: השונות של  זהה לזו של .

דוגמא:

רוני הזמין ליום הולדתו 50 מחבריו. לפני הגיעם הוא אמר לאמו שכלל חבריו בעלי IQ גבוה מזה של האוכלוסייה ב-7 יחידות. אמו הפסיכולוגית רצתה לבדוק את טענת בנו, ולכן העבירה לחברי רוני מבחני IQ ומצאה ממוצע של 105.

מהי עוצמת המבחן אם אמו של רוני משתמשת ב- ?

 

פתרון:

 

 

תחילה נמצא את ציון התקן הקריטי המתאים לגבול אזור הדחייה של :  1.645.

הערך הגולמי הקריטי המתאים לציון התקן הקריטי הוא:

 

 

הערך הגולמי הקריטי לצורך דחיית  ברמת בטחון של 95% הוא .

 

 

עתה נחשב עבור  (שמצאנו תחת , את ציון התקן תחת :

 

 

מצאנו את ציון התקן תחת , ומכיוון שזוהי התפלגות דגימה המתפלגת בקירוב נורמלית, נוכל לחשב את אחוז המקרים מעבר לנקודה זו (ממנה והלאה עד לסוף ההתפלגות):

בעמודה c נמצא שאחוז המקרים מעבר ל: Z=-1.45 ועד לקצה השלילי של ההתפלגות הוא .

ולכן מ: -1.45 ועד לקצה הימני של ההתפלגות יש .

 

מכאן שעוצמת המבחן שבוצע היא .  כלומר, במידה ו-  אכן נכונה, ב-92.6% מהמקרים אנו, כחוקרים, גם נדחה את .

נדגיש שוב:

 - עוצמת המבחן אינה תלויה כלל בנתוני המדגם (ממוצע), אלא בנתוני האוכלוסיות בלבד.

 - אנו לא בודקים את אמיתותה של .

 - השערות ניתנות לדחייה אך לא לקבלה.

עוצמה במבחן דו-צדדי

 

באופן עקרוני, הגדרנו עוצמה כאחוז המקרים מתוך  בהם דחינו את  כאשר  היא הנכונה. במילים אחרות, עוצמה היא השטח מתחת ל-  הנופל באזורי הדחייה של .
מתוך כך נובע שבבדיקת השערות דו-צדדית אנו נחשב את העוצמה הן בזנב העליון של
 והן בזנב התחתון שלה, זאת משום שלהתפלגות הדגימה של-  שני אזורי דחייה, וההתפלגות הנורמלית נעה בין מינוס אינסוף לבין אינסוף.

 

ניתן לראות זאת באיור הבא:

 

 

 

מכיוון שבזנב שאינו נמצא בצד של  השטח מזערי וזניח, אנו נתעלם ממנו בעת חישוב עוצמה כפי שניתן לראות באיור הבא:

 

דוגמא:

נתוני המבחן פסיכומטרי של כלל סטודנטים הם: , ובקרב סטודנטים אשר עברו קורס הכנה: .

מכון חדש המכין לפסיכומטרי טוען ליעילות רבה יותר בקרב בוגריו במבחן.  לאחר זמן מה מדווח המכון שבמדגם מקרי של בוגריו נמצאו הנתונים הבאים: .  האם המכון החדש יעיל יותר ברמת מובהקות של 0.01?

 

פתרון:

נבצע מבחן Z לבדיקת ההשערה.

 

1. הנחות: דגימה מקרית, והתפלגות הדגימה נורמלית כי התפלגות האוכלוסייה נורמלית (יתרה מכך:  ).

 

2. השערות:   

 

3. רמת מובהקות:   , השערה חד-צדדית.

 

4. בדיקת ההשערה בפועל: נמצא ב-EXCEL באמצעות פקודת NORMSINV מהו ערך ה-Z הקריטי לצורך דחייה ובעזרתו נחשב את :

 

 

אזור אי-הדחייה: .

 

530 נופל באזור אי-הדחייה.

 

5. מסקנה: לא ניתן לדחות את  ברמת ביטחון של 99%, לא ניתן לומר שהמכון החדש משפר את תוצאות המבחן הפסיכומטרי בקרב בוגריו.

 

דוגמא:

מהי עוצמת המבחן?

 

פתרון:

 

כאמור, אין קשר בין דחייה או אי-דחייה בפועל של בדיקת השערות כלשהי (עבור ממוצע מדגם מסוים) לבין חישוב העוצמה של מבחן.

 

הבה נחשב את עוצמת המבחן. נציב את  שחישבנו מתוך  ונמצא את ציון התקן שלו ב- :

 

 

 

העוצמה היא 18%.

האם ניתן להגדיל את עוצמת המבחן?

גורמים המשפיעים על עוצמת המבחן

 

ארבעה גורמים משפיעים על עוצמת המבחן, וזאת דרך מידת החפיפה שבין התפלגויות הדגימה של  ו- :

 

1. המרחק בין  ו- : ככל שהמרחק גדל, כך העוצמה גדלה.

 

2. גודל המדגם: ככל שהמדגם גדל, כך העוצמה גדלה וזאת משום שסטיית התקן של התפלגות הדגימה קטנה ככל שגודל המדגם גדל, ולכן החפיפה בין ההתפלגויות קטנה.

 

3. רמת המובהקות: ככל ש-  קטנה, כך העוצמה קטנה: וזאת משום הקשר הישיר בין  לבין .

 

4. סטיית התקן של האוכלוסייה: ככל ש-  קטנה, כך העוצמה גדלה משום שהחפיפה בין שתי ההתפלגויות קטנה.

 

לרוב, החוקר יגדיל את העוצמה ע"י הגדלת גודל המדגם (רצוי לא לגעת ב- .

► חזור                    המשך ◄