יחידה 5: הצגת נתונים  >> 5.1: טבלת שכיחויות

הצגת נתונים

 

כזכור, אנו עוסקים כעת בסטטיסטיקה תיאורית. במקרים רבים אנו מנתחים מספר גדול מאוד של נתונים. על מנת להציג מספר רב של נתונים בצורה יעילה פותחו מספר כלים להצגת נתונים.

 

לדוגמא: להלן ציוניהם של 408 תלמידים:

 


 

 כמובן שמהסתכלות על כל כך הרבה נתונים בו-זמנית לא ניתן להעריך את הציונים השכיחים, טווח הציונים וכו'....

טבלת שכיחויות

 

מקובל לרכז מספר גדול של נתונים בטבלה המכונה טבלת שכיחויות. בטבלה זו מרכזים את הנתונים למספר קטגוריות ומפרטים מספר נתונים/מדדים עבור כל קטגוריה:

אחוז שכיחות מצטברת

(סולם סדר ומעלה)

שכיחות מצטברת

(סולם סדר ומעלה)

אחוז

שכיחות

ערכים

(לפי סדר עולה)

מספר הופעות הערך

 

 

 

 

 

 

...

100

 

 

 

 

דוגמא: מספר הילדים ב-25 משפחות שנדגמו מצפון ת"א: 0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,2,2,2,2,2,3,3,4,7

 

טבלה 1: מספר הילדים במשפחה

%F(x)

F(x)

%

f(x) : מס' משפחות

מספר ילדים

36%

9

100*9/25=36%

9

0

64%

16

28%

7

1

84%

21

20%

5

2

92%

23

8%

2

3

96%

24

4%

1

4

100%

25

4%

1

7

טבלת שכיחויות מקובצת

 

כאשר מספר הערכים "גדול" רצוי לקבץ אותם לקטגוריות וליצור טבלת שכיחויות מקובצת.

בטבלה זו אסור שתהיה חפיפה בין גבולות הקטגוריות (גבול עליון של קטגוריה עם הגבול התחתון של הקטגוריה שמעליו) וכל ערך חייב להיות כלול בקטגוריה. תמיד מומלץ לסגור קטגוריות (לא לכתוב: "ומעלה" במקום הגבול העליון של הקטגוריה האחרונה).

 

דוגמא:

 

רוחב הקטגוריה

 

רוחב הקטגוריה  נקבע באופן שרירותי לפי טווח הערכים ומספר הקטגוריות הרצוי.

להלן הנוסחא לחישוב רוחב הקטגוריה:

 רוחב הקטגוריה

 מספר הקטגוריות הרצוי

 

כיצד קובעים את מספר הקטגוריות (  )?   אין לכך תשובה חד משמעית.

המלצות מתמטיות אפשריות:

כאשר N הוא מספר הנבדקים במדגם.

 

נחזור לרוחב הקטגוריה: אם התוצאה מהנוסחא  היא שבר, אזי מעגלים אותו כלפי מעלה.

כתוצאה מכך נוצרת "שארית": .

את ה"שארית" מחלקים באופן סימטרי בין גבולות שתי הקטגוריות הקיצוניות (התחתונה והעליונה).

 

דוגמא: טווח גילאי הנדגמים נע בין 18 ל-85 והחוקר מעוניין ב-6 קטגוריות.

כפי שניתן לראות בדוגמה רוחב הקטגוריה יוצא 11.33, מעגלים אותו כלפי מעלה ל-12 ואז מקבלים טווח ערכים של 72 לעומת הטווח המקורי שהיה 68. את השארית (4) מחלקים ל-2 ובכך במקום שגבולות הקטגוריות ינועו בין 18 ל-85, הן ינועו בין 16 ל-87.

 

הערה: ניתן (ולפעמים אף רצוי) להשתמש בקטגוריות ברוחב שונה.

גבולות אמיתיים ומדומים

 

גבולות ערכי המשתנה קשורים בסוג המשתנה (בדיד/רציף) ובמגבלות כלי המדידה.

לגבי מספרים רציפים (מספרים שבין כל שני ערכים ישנם אינסוף ערכים נוספים), כל ערך בכלי המדידה מייצג אינסוף ערכים בתווך שבין חצי יחידת מדידה מעל ומתחת לערך עצמו.

 

 

לדוגמא, אם משקל מסוים מודד עד לרמת דיוק הק"ג הבודד הרי שאם מישהו שוקל 100.2 ק"ג הרי שהמשקל יצביע על 100 ק"ג.

 

לצורך חישובים מתמטיים מסוימים, ומבלי לפגוע במשמעות המספרים, ניתן לקבוע "גבולות אמיתיים" למספרים בדידים.

למשתנים בדידים כמו מס' ילדים במשפחה אין בפועל מספר ערכים אינסופי בין כל שני ערכים, לדוגמא בין הערכים 2 ל-3 לא קיימים ערכים נוספים.

 

דוגמאות:

משקל ילדים:

גבולות אמיתיים

גבולות נראים

20.5 – 25.5

21 – 25

25.5 – 30.5

26 – 30

30.5 – 35.5

31 - 35

 

 

משכורת:

גבולות אמיתיים

גבולות נראים

10,500-15,500

11,000-15,000

15,500-20,500

16,000-20,000

 

 

בגבולות אמיתיים קיימת חפיפה בין גבולות הקטגוריות, אך חפיפה זו היא מדומה מפני שהערכים הם רציפים ולכן הגבול עצמו "המדויק" איננו קיים בפועל ובעצם כלי המדידה אינו מאפשר לנו למדוד ברמת הדיוק של ערך זה.

► חזור                    המשך ◄