יחידה 1: מבחן t  >>  1.4: מבחן t לשני מדגמים בלתי-תלויים

מבחן t לשני מדגמים בלתי-תלויים (t-test for independent samples)

כאמור, ישנה אפשרות נוספת לביצוע מבחן סטטיסטי מבלי שיודעים את ה-  ואת ה- .

 

אפשרות זו היא:

אם נדגום באופן מקרי מדגם מאוכלוסייה מסוימת ונחלק אותו מקרית לשתי קבוצות (הקצאה מקרית), אנו מצפים שהמדגמים יהיו דומים בכל תכונותיהם.

מכאן שאנו לא חייבים לזווג נבדקים אלא שאנו שיכולים לעבוד ברמת ממוצעי המדגמים. אם אין הבדל בין שתי קבוצות, אנו מצפים שהממוצעים שלהם יהיו דומים ושההפרש בין הממוצעים יהיה קרוב ל-0. גם כאן, בדומה למבחן t בין שני מדגמים תלויים, ניתן לשער בהשערת האפס הבדל בסיסי בין ממוצעי שתי האוכלוסיות ואז לבדוק במבחן אם ההבדל בין הקבוצות גדול, קטן או שונה ממנו.

אם  ו-  בלתי תלויים, הרי ש: .

לכן, מתוך התפלגות דגימה זו נוכל לחשב עבור כל שני מדגמים מסוימים את ההפרש בין ממוצעי שני המדגמים:    

אם  ו-  גדולים או שווים ל-30 או שהמשתנים מתפלגים נורמלית, אזי התפלגות הדגימה של z תתפלג נורמלית.

אם  ו-  אינן ידועות, נוכל לאמוד אותם.  במקרה זה, נחשב ערך t עבור כל זוג מדגמים (בניגוד לערך z כמתואר במשפט הקודם), ולהשתמש בהתפלגות דגימה המתפלגת  t ׁ(שוב, בהנחה שהתנאים המתאימים מתקיימים):

 

אבל למה שווה ?

הנחה בסיסית של המודל היא שוויון שונויות, לכן אנו מניחים שכל הבדל בין  לבין  הוא מקרי.

האומדן הטוב ביותר לשונות ה"זהה"  יהיה  ממוצע משוקלל של שתי השונויות הנותן משקל לשונות של כל אחד מהמדגמים לפי גודל המדגם:

מכאן שאם  ו-  בלתי תלויים ובהנחת שוויון שונויות:

שונות ההפרשים באוכלוסייה היא ,

האומדן לשונות זו הוא ,

וסטיית תקן היא .

ובנוסחא אחת:   

► חזור            המשך ◄