שאלות נפוצות - התפלגות t ומבחן t למדגם בודד

לקורס המקוון

 

לדף הראשי

1. שאלה:

האם כאשר ד"ח גדולות מ-120 נבצע פשוט מבחן Z תוך שימוש באומד האוכלוסייה, או שנבצע מבחן t ונשווה לדרגות החופש באינסוף? (בקיצור, איך יוגדר המבחן).

 

פתרון:

מבחן t מבוצע כאשר השונות לא ידועה באוכלוסייה, ולמרות שהלכה למעשה התפלגות t עם יותר מ-120 ד"ח תראה בדיוק כמו Z, זהו עדיין מבחן t לכל דבר ועניין.

 

2. שאלה:

לא ברור לי המשפט הבא מתוך הקורס הוירטואלי: "אומד חסר הטיה הוא אומד שממוצע התפלגות הדגימה שלו שווה לפרמטר האוכלוסייה".
הבנתי שאומד חסר הטייה הוא אומד שתוחלתו שווה לפרמטר האוכלוסיה. אם אני אקח אינסוף מדגמים ואבנה התפלגות דגימה של ממוצעים, אכן הממוצע של התפלגות זו יהיה שווה לממוצע האוכלוסיה, עד כאן נכון, אבל אם אני בונה התפלגות דגימה של ס.ת., הציפייה היא שממוצע ההתפלגות הדגימה הזו יהיה ס.ת. של האוכלוסיה? זה מה שיגיד לי שזה אומד לא מוטה? אז ממוצע או תוחלת?

 

פתרון:

יש כאן שני מושגים שונים שחשוב להבהיר:


1. אומד לא מוטה - כשאין לנו נתונים על האוכלוסייה, אנחנו מנסות להעריך את הפרמטרים. מאחר ואנחנו שואפות שההערכה תהיה מדויקת ככל האפשר וקרובה לנתוני האוכלוסייה, אנחנו צריכות למצוא/להשתמש באומד לפרמטר שאינו מוטה.
מהו אומד לא מוטה? - סטטיסטי שתוחלתו (ממוצע עבור אינסוף סטטיסטיים כאלו) שווה לפרמטר של האוכלוסייה.
או במילים אחרות - אם נבנה התפלגות דגימה של הסטטיסטי (אינסוף דגימות של אותו סטטיסטי) ממוצע התפלגות הדגימה יהיה שווה לפרמטר של האוכלוסייה.
במונחים של ס.ת. - תוחלתו של האומד הבלתי מוטה לס.ת. באוכלוסיה שווה לס.ת באוכלוסיה (סיגמה) או ממוצע התפלגות הדגימה של ס.ת. של אינסוף מדגמים בגודל n שווה לס.ת. באוכלוסיה (סיגמה).


2. ביצוע מבחן t - בבדיקת השערות מעניין אותנו תמיד הממוצע. כשהיו לנו כל הנתונים על האוכלוסייה פשוט השוונו את המדגם שלנו להתפלגות הדגימה של הממוצעים (עבור אותו גודל מדגם).
כשאין לנו את הנתונים על ס.ת. של האוכלוסייה אנחנו יכולות רק להעריך אותו - באמצעות חברנו משכבר הימים: האומד הבלתי מוטה! מכאן התהליך זהה למבחן Z, רק שהפעם אנחנו לא משתמשות בס.ת. של האוכלוסייה אלא אומדות אותו.
אנחנו, שוב ובדיוק כמו במבחן Z, יוצרות התפלגות דגימה של ממוצעים עבור מדגמים בגודל מסוים, רק שהפעם התפלגות הדגימה הזו מתפלגת t, וביחס אליה משוות את ממוצע המדגם שלנו.

 

3. שאלה:

מישהו יכול להסביר לי בבקשה מדוע בטבלת מבחן t כאשר עוברים למבחן דו צדדי, רמת המובהקות מוכפלת ב-2 (בניגוד להיגיון שלי שאומר שאם מחלקים את זה בין 2 צדדים זה אמור להתחלק ב-2)?

 

פתרון:

אם רמת המובהקות היא 0.1 במבחן דו צדדי, אז נחלק את זה בין 2 הצדדים, וכל צד יקבל 0.05. במבחן חד צדדי, אנחנו בעצם מסתכלים רק על הצד האחד הזה, ואז זה יהיה רק 0.05.