יחידה 4: הבינום  >> 4.2:  התפלגות ומבחן הבינום

כל פונקצית הסתברות היא בעצם התפלגות דגימה, דהיינו התפלגות תיאורטית המבוססת על אינסוף חזרות (אינסוף החזרות מתגלמות בהסתברויות המאורעות שידועים כביכול אחרי אינסוף נסיונות). בדוגמא שלנו אינסוף חזרות על זריקת 5 פעמים עם הסתברות לכל קליעה של 0.7.

 

לצורך בניית התפלגות הבינומית יש צורך ב-2 פרמטרים:  (מספר הניסיונות) ו-  (ההסתברות להצלחה בכל ניסיון).

 (  מתפלג בינומית)   נסמן את  כ- .

 

דוגמא: ב-applet הבא ניתן לצייר בקלות התפלגות בינומית. תחילה יש ללחוץ על הכפתור הצהוב – DrawDensity, ואז ניתן לשנות את ערכי ההסתברות  וה-n.

מספר הקליעות מתוך 5 זריקות עונשין כשבכל זריקה הסיכוי לקליעה 0.7:

אם נצייר את ההתפלגות שקיבלנו:

יצרנו התפלגות דגימה תיאורטית מתוך אוכלוסייה בעלת פרמטרים נתונים (לדוגמא: 5 זריקות, סיכוי להצלחה בכל זריקה 0.7) .

כרגע אם יגיע שחקן הטוען שרמת משחקו היא כמו זו של השחקן שלעיל, אנו נוכל לבחון עד כמה ביצועיו תואמים לאלו של השחקן המקורי. אם הוא טוב יותר או פחות מאשר השחקן שלנו.

נשמע מוכר? 

בדיקת השערות

 

ניתן לחשב את אזורי הדחייה באופן מדויק: קצוות ההתפלגות הכוללים  (כפול 100) אחוז מהמקרים. נוכל לחשב את הסיכוי להיות בזנב ולהשוות ל- .

דוגמא:

הטלנו מטבע מסוים 10 פעמים והתקבלו 9 פעמים עץ. האם סביר להניח שהמטבע הוגן (p=1/2) ברמת בטחון של 95%?

 

 

פתרון:

1. הנחות: אין תלות בין ההטלות.

2. השערה:

 = הסיכוי להצלחה באוכלוסייה. ברוב הספרים מסומן כ-p, גם אנחנו לפעמים נשתמש בסימון זה. אולם ננסה להיות עקביים ומכיוון שזה פרמטר נסמנו באות יוונית.

3. רמת מובהקות, השערה דו-צדדית

4. בדיקת ההשערה:

 

קביעת אזורי הדחייה: בכל זנב (השערה דו-צדדית) נחשב את השטח של הערכים הקיצוניים הכוללים פרופורציה של  מהמקרים.

מאחר והערכים בדידים לא נוכל להגיע בדיוק ל-   לכן תמיד נחמיר ונמצא את הערכים

שהפרופורציה שלהם לא עולה על .

אזור הדחייה: אנו סוכמים את ההסתברות המצטברת של הערכים עד לפני שמגיעים ל- .

 

ב-EXCEL:

אנו יוצרים עמודה עם הסתברות מצטברת בכדי לבדוק מהו איזור הדחייה משום שלא מספיק שערך מסוים קטן מ-  או מ- , אלא שכל הטווח עד אליו נמצא באזור הדחייה.

לכן אזור הדחייה בזנב התחתון .

כאשר  ההתפלגות סימטרית, לכן מספר האיברים באזור הדחייה התחתון שווה למספר האיברים באזור הדחייה העליון. מכאן שלא צריכים לחשב הסתברויות נוספות בזנב השני. .

אזור אי הדחייה:   ואזור הדחייה: .

9 (מספר הפעמים שהתקבל עץ מתוך 10 הניסיונות שבוצעו בפועל) נופל באזור הדחייה.

5. מסקנה:  מכאן שנוכל לדחות את  ולומר ברמת בטחון של 95% (לפחות) שהמטבע אינו הוגן.

בפועל רמת הביטחון בבינום גבוהה יותר כמעט תמיד משום שבזנב יש פחות מ-  (כפול 100) אחוזים אבל אנו אומרים עדיין ברמת ביטחון  לפי מה שקבענו מראש (וניתן להוסיף לפחות).

כאשר ההתפלגות אינה סימטרית , מספר האיברים באזור הדחייה העליון יהיה שונה ממספר האיברים שבאזור הדחייה התחתון ולכן יש צורך לחשב את שני הזנבות.

אם  קטן מדי, עלול להיות מקרה שבו אין איברים באזור הדחייה ("עם מספר כל כך קטן של ניסיונות לא ניתן להגיע לשום מסקנה מדעית"). לדוגמא, אם נטיל מטבע 5 פעמים, אין בכלל אזורי דחייה: .  כלומר, אפילו אפס לא מספיק בשביל לדחות את השערת האפס.

► חזור                    המשך ◄