סטטיסטיקה תיאורית היא תחום האחראי על איסוף, אחסון, הזמנה, הכנת טבלאות או גרפים וחישוב פרמטרים בסיסיים במערך הנתונים.
סטטיסטיקה תיאורית היא, יחד עם הסקה סטטיסטית או סטטיסטיקה מסקנת, אחד משני הענפים הגדולים של הסטטיסטיקה. השם שלה מציין את זה, הוא מנסה לתאר משהו. אך אל תתארו אותה בשום צורה שהיא, אלא בצורה כמותית. שקול משקל של קופסת ירקות, גובה האדם או סכום הכסף שעסק מרוויח. יכולנו לומר דברים רבים על המשתנים הללו. לדוגמה, נוכל לציין שקופסת עגבניות זו או אחרת שוקלת הרבה או שוקלת פחות מאחרות. בהמשך לדוגמא אחרת נוכל לומר שההכנסה של חברה משתנה מאוד לאורך זמן או שיש לאדם גובה ממוצע.
כדי להכתיב את ההצהרות לעיל, לגבי הרבה, מעט, גבוה, נמוך, משתנה מאוד או מעט משתנה אנו זקוקים למשתני מדידה. כלומר, עלינו לכמת אותם, להציע מספר. עם זאת בחשבון, נוכל להשתמש בגרמים או קילוגרמים כיחידת המידה כדי למצוא את משקלם של כמה קופסאות עגבניות כפי שאנו רואים. לאחר שנשקל שלושים קופסאות, נדע אילו שוקלים יותר, אילו שוקלים פחות, כמה הכי חוזר על עצמם או שיש פער גדול בין משקולות הקופסאות השונות.
סטטיסטיקה תיאורית נולדה עם רעיון זה, על מנת לאסוף נתונים, לאחסן אותם, ליצור טבלאות או אפילו גרפים המציעים לנו מידע בנושא מסוים. בנוסף, הם מציעים לנו מדדים המסכמים את המידע של כמות גדולה של נתונים.
סוגי משתנים סטטיסטיים
במסגרת נתונים סטטיסטיים תיאוריים, אנו יכולים לתאר את הנתונים בצורה איכותית או כמותית.
- משתנה איכותי: הכוונה היא לאיכות. דוגמאות: צבע העין של האדם או צבע השיער שלו.
- משתנה כמותי: הכוונה היא למדד כמותי. דוגמאות: גובה האדם בסנטימטרים או משקל האדם בקילוגרמים.
לפיכך, על משתנים אלה ניתן לחשב פרמטרים מסוימים. במיוחד על משתנים כמותיים. מכיוון, למשל, מה הערך הממוצע של צבע העיניים? אם יש חמישה אנשים עם צבע עיניים כחול וחמישה עם צבע עיניים ירוק, הממוצע לא יהיה שיש להם צבע עיניים כחול-ירוק ממוצע. לכן, במקרה זה לא ניתן יהיה לחשב חלק מהפרמטרים שנראה בהמשך.
משתנה סטטיסטיפרמטרים סטטיסטיים בסיסיים
על מנת לסכם את המידע הומצאו נוסחאות שונות שהציעו מדדים מסוג מסוים. לפיכך, ישנם כאלה המציעים לנו מידע על המרכז, אחרים על פיזור או שונות ואחרים על מיקומו של ערך.
- מדדי נטייה מרכזית: נקרא כך מכיוון שהם מספקים מידע על מרכז הנתונים. לדוגמא, הממוצע הוא מדד למגמה או למיקום מרכזי מכיוון שהממוצע נותן לנו ערך מרוכז של מערך הנתונים. היכן נוכל לומר שנקודת האמצע ממוקמת? במרכז, באמצע בערך. דוגמה נוספת למדד של נטייה מרכזית הוא החציון.
- אמצעי פיזור: הם ידועים גם כמדדי שונות. לדוגמא, סטיית התקן היא מדד של שונות כיוון שהיא אומרת לנו אם הערכים של מערך נתונים שונים מאוד או לא. שתי דוגמאות נוספות למדדי פיזור יכולות להיות השונות והטווח הסטטיסטי.
- מדידות מיקום: הם לא הידועים ביותר, אך משתמשים בהם בתדירות גבוהה. דוגמה לכך נמצאת באחוזונים או בעשירונים. כאשר נתונים ספציפיים נמצאים באחוזון ה -90, המשמעות היא ש -90% מהנתונים נמצאים מתחת לנתונים האלה. ישנם מדדים אחרים של מיקום כגון רביעיות או כמה גרסאות כגון הרבעון הראשון.
התפלגות תדרים
מעניין גם לראות כיצד התדרים מחולקים. לשם כך, ישנם מושגים מסוימים שעלינו לדעת:
- תדירות מוחלטת: זהו המספר הכולל של הפעמים בהן חוזרת התצפית. לעיתים ניתן להציג תצפיות במרווחים.
- תדירות יחסית: זהו המספר באחוזים שחוזרים על עצמם תצפית או קבוצה שלהם.
- תדר מצטבר: ניתן לצבור יחסי או להצטבר מוחלט. מציין את הסכום שנצבר עד לתצפית מסוימת.
טבלאות וגרפים בסטטיסטיקה תיאורית
למרות שטבלאות וגרפים אינם ייחודיים לסטטיסטיקה תיאורית, הם מאפיינים זאת. בדוחות, במחקרים ובמחקרים השימוש בגרפים נפוץ מאוד. הם עוזרים לנו להציג את המידע בצורה פשוטה ומוגבלת יותר.
כמובן שבתוך הטבלאות והגרפים יש כמות עצומה של סוגים. להלן מספר דוגמאות לגרפים וטבלאות שנמצאים בשימוש תכוף.
- היסטוגרמה.
- גרפיקה של בר.
- תרשים עוגה.
- טבלאות הסתברות.
- שולחנות דו מימדיים.
- תרשים תיבה.
דוגמאות לסטטיסטיקה תיאורית
דוגמה לסטטיסטיקה תיאורית תהיה כאשר אנו רוצים לחשב את היעדים הממוצעים למשחק של כדורגלן. זוהי סטטיסטיקה תיאורית, שכן אנו מנסים לתאר משתנה (מספר יעדים). במקרה זה, על ידי חישוב מדד.
אז לומר שרונאלדו כבש 1.05 שערים למשחק במהלך 30 המשחקים האחרונים הוא ביטוי סטטיסטי ראוי לתיאור.
נוכל לומר למשל, כי 30% מבני כיתתו של חואן הם בעלי עיניים כחולות, 60% חומים והשאר 10% שחורים. זה יהיה משתנה איכותי (צבע עיניים), אך אנו מתארים את התדירות בה הוא מופיע.