שאלות נפוצות - הצגת נתונים

לקורס המקוון

 

לדף הראשי

1. שאלה:

בטבלת שכיחויות מקובצת, איך מחשבים צפיפות (d)?

 

פתרון:

צפיפות של קטגוריה = שכיחות הקטגוריה חלקי הרוחב שלה.

כאשר הרוחב מוגדר כ:

Xh-Xl+1 (בגבולות נראים)

או Xhh-Xll (בגבולות אמיתיים)

 

2. שאלה:

מתי נעדיף להשתמש בהיסטוגרמה ומתי בפוליגון, הרי שניהם מתארים לי צפיפות בציר ה-Y, בשניהם השטח מתאר שכיחות, ושניהם חייבים להיות סגורים. (כמובן במשתנים מסולם רווח ומעלה, עם גבולות אמיתיים).

 

פתרון:

נשתמש בהיסטוגרמה במשתנה בדיד ובפוליגון במשתנה רציף. פוליגון מתאים למשתנה רציף כיוון שהוא מראה שהקפיצה מקטגוריה לקטגוריה היא הדרגתית.
אפשר להשתמש בפוליגון כשהקטגוריות לא שוות רוחב, אבל צריך להיזהר כשמציירים אותו (לא למתוח קו מאמצע הקטגוריה כמו בד"כ) על מנת שהשטח לא יצא מעוות. לכן למען הנוחות, בקורס זה נצייר פוליגון רק כאשר הקטגוריות הן שוות רוחב.

 

3. שאלה:

ציונים הם משתנים בדידים או רציפים?

 

פתרון:

ציונים במבחן הם בדידים (בין כל 2 ציונים לא ניתן להכניס אינסוף ציונים)?
ההצגה הנכונה ביותר לנתונים בסולם רווח/מנה בדידים היא היסטוגרמה.
בגלל אילוצים לצורך חישובים מתקדמים (שנלמד בקרוב) אנו נוכל להלביש לדוגמא עקומת גאוס על היסטוגרמה בידיעה שיש פער ביניהן אבל הפער יחסית קטן ויאפשר לנו לחסוך בחישובים ולהגיע לרמת דיוק לא רעה בכלל.
אבל הלבשה זו תהיה לצרכים אחרים, ולא לצרכים של הצגת הנתונים.

 

4. שאלה:

שאלה מספר 1 בשאלות התרגול להצגת נתונים.
בחרתי לרשום בטבלה את המשתנים בסדר היררכי אך הפוך לזה המופיע בתשובה,
מבואס מדי עליון ושמח מאוד תחתון.
כמובן שנתוני שכיחות המצטברת משתנים בהתאם.
האם תשובה שכזו קבילה או שיש סדר מסוים להצבת נתונים בטבלה (מהערך ה"גבוה" ל"נמוך") ?

 

פתרון:

בעיקרון זה לא משנה, העיקר שתשובתך נכונה. יחד עם זאת נהוג לסדרם מהנמוך לגבוה.

 

5. שאלה:

יש לי בעיה עם השלמת הגבולות בהתחלה ובסוף בציור פוליגון. מצד אחר נאמר שאסור לעשות זאת ומצד שני כדי לשמור על השטח מחברים את כל נקודות האמצע ומוסיפים את נקודות האמצע
של קטגוריות דמיוניות.
אם מישהו יוכל להסביר לי בבקשה מתי משלימים קטגוריות דמיוניות ומדוע?

 

פתרון:

נאמר שאסור להוסיף גבולות דמיוניים במידה והקטגוריות בנתוני מקור אינן סגורות (לדוגמא שאלה עם ההוביטים במטלה מכאן שלא ניתן לעשות היסטוגרמה על סמך קטגוריות לא סגורות. מכיוון שפוליגון עושים על סמך היסטוגרמה אז כמובן שלא ניתן לעשות פוליגון במידה שהקטגוריות בנתוני המקור אינן סגורות.
בפוליגון מוסיפים גבולות דמיוניים על מנת לשמור על כל שטחה של ההיסטוגרמה (השטח מייצג שכיחות). אם לא נוסיף גבולות, נאבד חלק מהשטח.

 

6. שאלה:

האם משתנה בדיד הוא בהכרח בסולם שמי וסדר ומשתנה רציף בסולם רווח ויחס?

 

פתרון:

משתנה בדיד יכול להיות שמי (לאום) או סדר או יחס (מס' עלים שעל עץ) .
אבל:
משתנה שמי או סדר תמיד בדיד.
משתנה רווח/יחס יכול להיות בדיד או רציף.

 

7. שאלה:

מה זה קטגוריה פתוחה ומה זו קטגוריה סגורה?

 

פתרון:

קטגוריה סגורה היא כזו שהגבולות שלה מוגדרים בדיוק (0-6, 12.5-20.8, וכו'). בקטגוריה פתוחה אחד מהגבולות לפחות לא מוגדר (5 ומעלה, 10 ומטה, וכו'). כנ"ל במקרים שלכאורה קיים גבול טבעי (משקל בק"ג: 20 ומטה). ברגע שבקטגוריה עצמה יש גבול שאינו מוגדר, היא פתוחה.
הרלוונטיות להצגות גרפיות היא במקרה שהנתונים מתאימים להיסטוגרמה/פוליגון/עקומה, אבל אחת מקטגוריות פתוחה (קטגוריות סגורות הן דרישה מוקדמת להצגות אלה), ניאלץ לרדת ברמת ההצגה ולהשתמש בדיאגרמת מקלות.