שאלות נפוצות - התפלגות הבינום

לקורס המקוון

 

לדף הראשי

1. שאלה:

במטלה 5, בשאלה 16279 (גאידמק ואבי מלר), למה המבחן הוא חד צדדי אם השאלה היא "האם ניתן לקבוע ששחקנים ישראלים מבקיעים יותר מזרים?"
אני יכול להסביר לעצמי איכשהו אם מתייחסים לשאלה הראשונה - ארקדי מתלבט מה יותר כדאי...

אבל בשאלות לדוגמא אני ממש לא מבין:
- שאלה 1 בקירוב לנורמלי: "האם ניתן לומר שאחוז התאונות קטן במיוחד?" ובתשובות ההשערה דו"צ
- שאלה 3 בקירוב לנורמלי: "החוקר טען שפרופורציית הבנים הנולדים גבוהה יותר מבשאר העולם" ובתשובות ההשערה דו"צ

למה??

תודה למשיבים!

 

פתרון:

בדיוק כמו קודם ההשערה היא חד"צ אך ורק אם נתון לנו שלמישהו היתה השערה לפני התוצאות של המדגם הספציפי. אל תשפוט לפי איך שהשאלה מנוסחת לנו, אלא לפי איך ששיער אותה מושא הדוגמה טרם קבלת התוצאה. למשל- בשאלה על גאידמק דיברו על הבדל/שוני ולא במונחים של יותר/ פחות... ולכן זה דו"צ
אסור לך להחליט על כיוון ההשערה לפי השאלה שנשאלת! זה מאוד מבלבל זה נכון.. אבל חשוב שתשים לב מה החוקרים שיערו, מה הם ציפו, לפני שקיבלו את התוצאה של המדגם. זה לא משנה איך השאלה נוסחה לנו אלא מה הם (מושאי הדוגמה) שיערו/ציפו/הניחו מראש....

בקשר לשאלה עם המפעל, למשל, קודם נאספו הנתונים, לאחר שקיבלנו את מספר הנפגעים אנו נשאלים על כיוון מסוים, אך כשנערכה הדגימה לא מצוין כיוון כלשהו. אם היו משערים לפני הדגימה על כיוון מסוים, אז יש לנו השערה חד"צ. אבל אם לא שיערו, אספו את הנתונים, ואז ראו את הכיוון ושיערו עליו, זאת לא חוכמה גדולה.
הדגש הוא מתי שוערה ההשערה שהמשערים שיערו.

 

2. שאלה:

פסיכולוגית התפתחותית חוקרת נטייה של בנות בגיל הילדות להזדהות עם דמויות נשיות מעולם הפנטזיה. היא משערת שעם הכניסה לבית הספר נטייה זו פוחתת בהשוואה לגיל הגן. היא גם סבורה שנטייה זו משתקפת, בין היתר, בתחפושות שהילדות בוחרות לפורים. ידוע שבגיל הגן 25% מהבנות מתחפשות לפֵיָה. לצורך בדיקת השערתה היא דגמה מקרית 40 ילדות בכיתה א'. לפני בדיקת התחפושות החוקרת מחשבת את עצמת המבחן. אנא עיזרו לחוקרת המבולבלת: מהו הערך המספרי שעליה להציב בחישוב Z תחת – H1? (הניחו שרמת הביטחון של המבחן היא 95%)
למישהו יש מושג מאיפה מתחילים לפתור?

 

פתרון:

הפסיכולוגית רוצה לחשב עוצמה ומבקשים ממך למצוא את הערך המספרי שעליה להציב בחישוב z תחת H1 כלומר עליך למצוא את x גג קריטי. הינך יכולה לחשב את הממוצע ואת סטיית התקן ע"פ הנוסחאות שנתנו המתרגלים וע"פ נתונים אלו וכן ע"פ רמת המובהקות את יכולה לחשב את x גג קריטי, רק אל תשכחי לעשות תיקון לרציפות.

 

3. שאלה:

אני אשמח לקבל עזרה לגבי שתי השאלות של הפסיכולוגית והילדות שמתחפשות לפיות.
בשאלה הראשונה מקבלים שהממוצע הוא 10 וסטיית התקן היא 2.7386
מאחר וזה מבחן חד צדדי אז Z=1.645
וסה"כ מקבלים שערך ה-X הוא 5.49 (הרשיתי לעצמי לעגל ל5.5)

עכשיו אני אמרתי שזה הערך אחרי שהוסיפו לו 0.5 מאחר ואנחנו בקירוב לנורמלי (והוא קטן יותר מהממוצע) משמע הערך הקריטי האמיתי הוא 5.
בחישוב העוצמה תחת H1 - מאחר ואנחנו מחמירים כשאנחנו מחשבים את העוצמה עכשיו אנחנו צריכים לבחור את הגבול התחתון של הערך הזה - שהוא 4.5 - וסה"כ אני בסדר עם השאלה הראשונה.

לגבי השאלה השנייה - שאלו מהו הערך הכי גדול שיכול לצאת לה ובכל זאת היא תדחה את השערת האפס. אמרנו שאיזור הדחייה של התפלגות מסויימת כולל את הערך הקריטי (שהוא חמש במקרה שלנו) - אז למה התשובה היא 4 ולא 5?

 

פתרון:

5.49 הוא חלק מהמספר 5 (שנע בין הגבולות האמיתיים 4.5 ו-5.5), ולכן קבלת הערך 5 הוא בדיוק הגבול בין דחייה לאי דחייה.
בניסוח ההשערות שלנו, גדול שווה הוא השערת ה-0, וקטן - הוא השערת ה-1.
מאחר ומדובר רק במספרים שלמים שיכולים להתקבל, המספר 4 הוא הגדול ביותר, עבורו נדחה את השערת ה-0.
כשמבודדים את ה-x הקריטי בשאלות כאלה המערבות גם תיקונים לרציפות, כדאי גם להכניס את ה-x הקריטי שקיבלתם מהבידוד בחזרה לנוסחת ה-Z ולוודא שהוא אכן כלול באיזור הדחייה (או האי-דחייה). כלומר, לוודא שמה שקיבלתם הוא באמת התשובה הנכונה.

 

4. שאלה:

באילו מן המקרים הבאים ייתכן מצב בו סטיית התקן של התפלגות הדגימה של H0 אינה שווה לסטיית התקן של התפלגות הדגימה של H1?

א.מבחן t למדגמים בלתי-תלויים, כאשר הנחת שוויון שונויות אינה מתקיימת.
ב.מבחן t למדגמים תלויים, כאשר מתקבלת תוצאה מובהקת.
ג.עבור מקרים מסוימים, כאשר מבצעים את הקירוב לנורמאלי של מבחן הבינום.
ד.בכל מקרה כאשר מבצעים את הקירוב הנורמאלי של הבינום.
ה.מבחן t למדגמים בלתי-תלויים, כאשר הנחת שוויון שונויות מתקיימת.

התשובה הנכונה היא ג'. אמנם ברור שזה צריך להיות הבינום כי טעות התקן שלו היא
sqrt n*p*q, ואם ההתפלגות אליה משווים היא בעלת משתנה אחד שונה אז כל טעות התקן משתנה. אבל התופעה הזאת יכולה ל"הייתכן" (זה נוסח השאלה) בכל קירוב לנורמלי של הבינום. לא נאמר מתי המשפט הבא נכון בהכרח. יש איזה תנאי אחר שאני מפספס כאן?

 

פתרון:

כפי שניתן לראות מהנוסחא לחישוב סטיית התקן, סטיית התקן תהיה שווה ב- H0 וב- H1 כל עוד p*q יוצא שווה בשתיהן. יש לנו שלוש משוואות:
1. n*p1*q1=n*p0*q0
2. p1+q1=1
3. p0+q0=1

אפשר לראות ש"חסרה" משוואה על מנת לפתור את המערכת. כל שילוב של p0 ו- p1 שפותר את המערכת ייתן שוויון שונויות בין H0 ל- H1, ויש אינסוף שילובים כאלה.
זה לא עניין סמנטי, זה עניין אלגברי. בעיקרון זה לא אותו הדבר ב- H0 וב- H1. יש מקרים מסוימים שבהם זה כן, "במקרה", אותו הדבר. לכן התשובה היא שזה נכון במבחן הבינום, אבל שזה רק נכון לפעמים.

 

5. שאלה:

ממטלה 5

במידה ואפשר, תפתרו באמצעות הקירוב הנורמלי של הבינום
פסיכולוגית התפתחותית חוקרת נטייה של בנות בגיל הילדות להזדהות עם דמויות נשיות מעולם הפנטזיה. היא משערת שעם הכניסה לבית הספר נטייה זו פוחתת בהשוואה לגיל הגן. היא גם סבורה שנטייה זו משתקפת, בין היתר, בתחפושות שהילדות בוחרות לפורים. ידוע שבגיל הגן 25% מהבנות מתחפשות לפֵיָה. לצורך בדיקת השערתה היא דגמה מקרית 40 ילדות בכיתה א'. לפני בדיקת התחפושות החוקרת מחשבת את עצמת המבחן. אנא עיזרו לחוקרת המבולבלת: מהו הערך המספרי שעליה להציב בחישוב Z תחת – H1? (הניחו שרמת הביטחון של המבחן היא 95%)
התשובה היא 4.5...

נראה לי שהשאלה בעצם שואלת מה הוא ה-X הקריטי... האם אני צודקת?
ואיפה מתבטא בחישוב הקירוב הנורמלי של הבינום...

במידה ואפשר, תפתרו באמצעות הקירוב הנורמלי של הבינום
פסיכולוגית התפתחותית חוקרת נטייה של בנות בגיל הילדות להזדהות עם דמויות נשיות מעולם הפנטזיה. היא משערת שעם הכניסה לבית הספר נטייה זו פוחתת בהשוואה לגיל הגן. היא גם סבורה שנטייה זו משתקפת, בין היתר, בתחפושות שהילדות בוחרות לפורים. ידוע שבגיל הגן 25% מהבנות מתחפשות לפֵיָה. לצורך בדיקת השערתה היא דגמה מקרית 40 ילדות בכיתה א'. אם אכן היא צודקת בהשערתה, ברמת בטחון של 95%, ואחוז הילדות שמתחפשות לפֵיָה בכיתה א' הוא 15% - מהי עצמת המבחן שהיא מבצעת?

התשובה היא 25.3%

 

פתרון:

כל שעלייך לעשות בשאלה הראשונה זה לחשב את ה-X קריטי. החישוב מתבצע בצורה הבאה: נתון שהסיכוי שילדה תתחפש לפיה הוא 25% מכאן שp=0.25 עכשיו את יכולה לחשב גם את סטיית התקן וגם את הממוצע לפי הנוסחאות שבטבלה. עם עיגול קל תגיעי ל-4.5.
לגבי השאלה השנייה פותרים את השאלה בדיוק כמו שפתרנו בסמסטר הראשון: גילינו בשאלה הקודמת ש-X קריטי שווה ל-4.5 ועכשיו מחשבים את הממוצע ואת סטיית התקן לפי p=0.15 ה-Z שמגיעים אליו הוא 0.67 מכיוון שה-Z נמצא אחרי הממוצע עוצמת המבחן שווה למה שמופיע בעמודה C.

 

6. שאלה:

מה זאת אומרת לחשב עוצמה משני הצדדים? לא אמור להיות זניח כך שאני לא מתייחסת לצד אחד? ואם לא איך אני עושה את זה?

 

פתרון:

גם מהזנב העליון וגם מהזנב התחתון,זה המבחן היחידי שאנחנו מחשבים בו עצמה של 2 הזנבות (במקרה של השערה דו"צ כמובן..).
כדי לחשב את העוצמה בשני הזנבות עליך למצוא את שני ה-x קריטיים - לפני פלוס מינוס של ה-Z הקריטי ואז למצוא את שני ה-Z ביטא תחת H1 ... משם את יכולה כבר להסתכל בטבלת Z ולראות אם הזנב הנוסף הוסיף משהו..

 

7. שאלה:

כאשר n*p>=5 משתמשים בחישוב ידני של בינום או בקירוב נורמלי שלו?

 

פתרון:

קירוב לנורמלי יתבצע אם n*p או n*q (הקטן מביניהם) גדול/שווה 5. כלומר, לפי שאלתך, אם ה q גדול מה p אז- קירוב ינורמלי. אם זה מבלבל אותך אז פשוט תבדקי אם שניהם גדולים/שווים 5. אם כן- קירוב נורמלי. אם לא- בינום רגיל.

בכל מקרה, ניתן לבצע חישוב ידני גם במצב בו אפשר לבצע קירוב לנורמלי, אך הקירוב יחסוך לנו זמן רב.

 

8. שאלה:

עשיתי בינום עם קירוב לנורמלי, מצאתי את Z ואת X קריטי תחת השערת האפס... מכיוון שמדובר בקירוב לנורמלי החישוב שלי לקח בחשבון שהורדתי 0.5, (אם הקריטי גדול מהממוצע) או הוספתי 0.5 אם הקריטי שלי קטן מהממוצע.

אני אשמח אם מישהו יפרט באופן מסודר, ושוב, בבקשה לאט וברור כי אני לא מבינה, מה שלבי העבודה בחישוב עוצמה עם קירוב לנורמלי בבינום...

 

פתרון:

אחרי שמצאת מהו הערך הקריטי תגדירי לך את איזורי הדחייה (במספרים בדידים), וכמו בדוגמה שלמטה, אם יצא לך X קריטי 9.12 (והוא בחלק הימני של ההתפלגות כלומר גדול מהממוצע), כלומר הוא בין 8.5-9.5 ושייך למספר הבדיד 9. אך כל החלק של המספר 9 הנמצא בין 8.5 ל 9.12 נמצא עדיין באזור אי הדחייה, לכן, אנו מחמירים עם עצמנו תמיד ושמים את 9 כולו באזור אי הדחייה, כלומר נדחה החל מהמספר 10 (אזור דחייה X גדול מ-9 או X גדול שווה ל-10).

נעבור להתפלגות H1: כיוון שאזור הדחייה שלנו הוא גדול שווה ל-10 נחשב את הסיכוי להיות באזור זה תחת H1, הX קריטי שנשים בנוסחה יהיה הפעם 9.5 (הגבול התחתון האמיתי של המספר 10 שנמצא באזור הדחייה) פחות ממוצע H1, חלקי טעות התקן (ששונה מטעות התקן בהשערת ה-0 כיוון שמדובר בפרופורציות שונות, לא לשכוח!)

אם ההשערה במקור הייתה דו צדדית, את עושה את אותו תהליך עם אזור הדחייה בצד השני ומחברת את ההסתברויות - זו עוצמת המבחן.