יחידה 10: התפלגות הדגימה  >> 10.3: משפט הגבול המרכזי

משפט הגבול המרכזי  (Central limit theorem)

אם n גדול מספיק , התפלגות הדגימה של ממוצעים תתפלג בקירוב נורמלית ללא קשר לצורת ההתפלגות המקורית.

המחשה למשפט זה ניתן היה לראות בהתפלגות הדגימה שנוצרה מבניית התפלגות הדגימה מהתפלגות האוכלוסייה בצורת "נעל" (שם אפילו כאשר   כבר "רואים" את צורת הפעמון הנבנית).

 

משפט זה הינו המרכזי והחשוב ביותר עבור ההסקה הסטטיסטית.

 

כפי שלמדנו, חישוב ציוני תקן בהתפלגות נורמלית מאפשר להשוות בין ציונים שונים בהתפלגויות שונות ולדעת את מיקומם היחסי של כל אחד. יתרה מכך, החישוב מאפשר לנו לחשב את האחוזון של כל ציון בהתבסס על ממוצע וסטיית התקן של האוכלוסייה ממנה הוא נדגם. משמעות משפט זה הינה שללא קשר לצורת ההתפלגות המקורית ממנה אנו דוגמים את המדגם, אם הוא מספיק גדול הרי שהתפלגות הדגימה ממנה הוא "נדגם" תהיה בקירוב נורמלית.

תכונות התפלגות הדגימה של ממוצעים

 

ממוצע

אם בונים התפלגות דגימה של ממוצעים, תוחלת ההתפלגות תהיה שווה לממוצע האוכלוסייה ממנה נלקחו המדגמים: .

 

מכאן ש-  הוא אומד חסר הטיה ל- .

 

הוכחה:

תזכורת: תוחלת של סכום שווה לסכום התוחלות.

 במקרה זה נחשב תוחלת של ממוצעי המדגמים:

 

מכיוון שהסטטיסטי ממוצע הינו אומד בלתי מוטה, הרי שממוצע כל אחד מהמדגמים הוא ממוצע האוכלוסייה. 

ומכיוון שסכום התוחלות מוכפל פי , הרי שממוצע התפלגות הדגימה של הממוצעים הוא ממוצע האוכלוסייה: 

 

טעות התקן: Standard error (of the mean) – SEM

סטיית התקן של התפלגות הדגימה של ממוצעים, הנקראת טעות התקן, שווה ל-

 כאשר n שווה לגודל המדגמים שנדגמו.

 

הוכחה:

תזכורת: אם המשתנים אינם תלויים אזי שונות של סכום שווה לסכום השונויות:

 

תזכורת: השונות של קבוע כפול משתנה שווה לקבוע בריבוע כפול שונות המשתנה:

 

אנו מחפשים את שונות התפלגות הדגימה של הממוצעים:

 

לפי הכלל    נוציא את ה-  החוצה מתוך השונות ונעלה אותו בריבוע:

 

עתה נשתמש ב-   ונראה כי נותרנו עם:

 

עתה, אם נוציא שורש, נראה כי סטיית התקן של התפלגות הדגימה של הממוצעים (טעות התקן) שווה לסטיית התקן של האוכלוסייה חלקי שורש n:

באיור הבא ניתן לראות המחשה של משפט הגבול המרכזי:

 

בשורה העליונה מצוירות שלוש התפלגויות שונות.

בשורות הבאות ניתן לראות כיצד גודל המדגם משפיע על התפלגות הדגימה של הממוצעים וכיצד ההתפלגות נהיית בקירוב נורמלית ועם סטיית תקן הולכת וקטנה ככל שהמדגם גדל:

 

 

 

אמנם היום ישנן גם שיטות משוכללות יותר, אך הפרסום של Gauss אודות טעות התקן (בהקשר של רגרסיה) גרם ל-Simon LaPlace (1749-1827) לקשר בין משפט הגבול המרכזי וניבוי לינארי, דבר אשר נהפך לכלי הבסיסי של סטטיסטיקאים למשך דורות.

► חזור                    המשך ◄