Boxplot, מאנגלית, boxplot, הוא ייצוג של משתנה כמותי או קטגורי לצורך זיהוי מהיר של רביעיות מערך הנתונים.
במילים אחרות, תיבת מגרש היא גרף המייצג משתנה כמותי או איכותי דרך הרבעונים.
בסטטיסטיקה, זהו כלי שימושי לייצוג מערכי נתונים בדידים ורציפים כאחד.
חשוב לזכור כי המשתנים המשתנים האיכותיים או שנועדו לייצג סדר או קטגוריה חייבים תמיד להיות מקושרים לאינדקס מספרי גדול מ- 0, כך שהם יכולים להופיע בתרשים וניתן לחשב את הסטטיסטיקה המתאימה.
עלילת תיבה והיסטוגרמה
עלילת תיבה אינה אלא היסטוגרמה הנשקפת מלמעלה, ובאותה צורה, היסטוגרמה היא עלילת תיבה הנשקפת מהצד. דוגמה ניתן לראות להלן.
המאפיין הראשון ששתי התרשימים חולקים הוא המינימום והמקסימום של מערך הנתונים. פסי הקצה אחרי המקפים מציינים את המינימום (פס תחתון) ומקסימום (פס עליון). חריגים יוצגו מחוץ לטווח המקסימום והמינימום. כלומר, מעבר לסורגים אחרי המקפים. אנו יכולים למצוא גם מגרשי תיבות אופקיים.
במבט חטוף ניתן לראות שרוב הנתונים מרוכזים בתצפיות בסמוך למינימום בשני הגרפים. זה מצוין על ידי עלילת התיבה בה התיבה קרובה למינימום מהמקסימום. אם נסתכל על ההיסטוגרמה, נראה שהתצפיות השכיחות ביותר הן התצפיות שקרובות למינימום ורחוק מהמקסימום.
מידע על מגרש תיבות
המידע המסופק מעלילת התיבה הוא כדלקמן:
- החלק התחתון של התיבה הוא הרבעון הראשון (Q1).
- הסרגל באמצע התיבה הוא הרבעון החציוני או השני (Q2).
- החלק העליון של התיבה הוא הרבעון השלישי (Q3).
- הטווח הבין-רבעוני או ה- IQR יהיה גובה התיבה, כלומר ההבדל בין Q3 ו- Q1.
מפתח עלילת תיבה
ייצוג גרפי זה נקרא עלילת תיבה מכיוון שהוא נראה כמו תיבה. לכן, כדי לזכור את הגרף הזה, נצטרך לחשוב רק על אובייקט מרובע או על תיבה.
לקוראים המכירים את מחיר הנכסים הפיננסיים הם יראו יותר דמיון לנר. הנרות שאתה רואה בהצעת המחיר הם חלקות קופסאות המותאמות לחלון הזמן שנבחר.
יתרונות וחסרונות בעלילת התיבה
בין היתרונות והחסרונות של תרשים זה אנו מוצאים את הדברים הבאים:
יתרון
- ראייה גלובלית של התדירות המוחלטת של משתנה כמותי או איכותי.
- הכרת מינימום, מקסימום ורביעי מערך הנתונים ללא צורך בחישובם.
- זיהוי ערכים קיצוניים מהר יותר מאשר בהיסטוגרמה מכיוון שערכים קיצוניים מסומנים במעגלים מחוץ למקסימום ולמינימום.
חסרונות
- אם מערך הנתונים קטן, ביצוע עלילת תיבה לביטוי נתונים אלה יקשה על ההבנה.
דוגמה לעלילת תיבה
אנו מניחים כי אנו רוצים לייצג את מספר רוכבי האופניים העוברים את ביתנו במשך שנה. ראשית, אנו סופרים את רוכבי האופניים ואוספים את המידע בטבלה.
באמצעות תוכניות מסוימות כגון R או Excel אנו יכולים ליצור את הגרף המוצג להלן.
הודות לייצוג מספר רוכבי האופניים דרך עלילת התיבה, נוכל במהירות לאן היכן החציון נמצא, הרבעונים האחרים, המקסימום והמינימום. במקרה זה אין לנו נתונים לא טיפוסיים שכן מעבר למקסימום ולמינימום אין כלום.
היישום של גרף מסוג זה נפוץ מאוד לאור פשטותו ושימושיותו בתחומים רבים מעבר למימון וכלכלה.