משתנה קטגורי - מה זה, הגדרה ומושג

תוכן העניינים:

משתנה קטגורי - מה זה, הגדרה ומושג
משתנה קטגורי - מה זה, הגדרה ומושג
Anonim

משתנה קטגורי הוא אחד שמאפשר סיווג סדרת נתונים באמצעות ערכים קבועים הקשורים לאיכות או קטגוריה ספציפיים.

המשתנה הקטגורי, בניגוד למשתנים קרדינליים או רציפים (המאפשרים חישובים מספריים), מסווג אנשים או מקרים. בדרך כלל הם לוקחים ערכים המיוצגים על ידי מספרים שלמים, כמו אחד או אפס, אך אלה הם רק ייצוגים.

בדוגמה נראה את זה בפירוט רב יותר.

הבדלים בין משתנה קטגורי ורציף

ישנם כמה הבדלים בין המשתנה הקטגורי לבין המשתנה הרציף או הקרדינלי שצריך לדעת. בואו נראה הכי רלוונטי.

  • ראשית, המשתנה הקטגורי משמש לקיבוץ ומשתנה רציף לספירה. במילים אחרות, הראשון מאפשר ליצור קטגוריות עם סדרת נתונים. למשל, מין או מספר ילדים. השנייה נותנת לנו מידע מספרי. למשל גיל.
  • המשתנה הקרדינלי מאפשר חישובים מספריים, האחרים לא. בדרך זו, בשניים הראשונים אנו יכולים לדעת את האמצעים או השונות, בעוד שבאחרים רק נתונים מסוימים, כגון המצב או אחוז הקטגוריות.
  • הקטגוריות מועילות מאוד לדעת מידע איכותי, כלומר איכות נתונים מסוימת. הרציפים מספקים לנו נתונים כמותיים, כלומר כמויות וערכים המיוצגים על ידי מספרים.

טכניקות סטטיסטיות למשתנים קטגוריים

לאחר מכן, בואו נראה את הטכניקות הסטטיסטיות הנפוצות ביותר במשתנים קטגוריים, ונשווה אותן לאלו של משתנים רציפים או קרדינליים.

  • סטטיסטיקה תיאורית: בסוג זה של משתנים, הניתוחים מבוססים בדרך כלל על תרשימי עמודות ואחוזים, בין היתר. קרדינלים מאפשרים ליישם טכניקות ניתוח לחישוב סטטיסטיקה של מיקום כגון כמותים, או סטטיסטיקה של פיזור כגון שונות.
  • ניגוד ההשערה: בקטגוריה ניתן יהיה להקצין את התוצאות באמצעות מבחני השערה שאינם פרמטריים. מצד שני, הרציפים משתמשים בניגודים פרמטריים שניתן להסיק גם מהם.
  • טכניקות רגרסיה: במקרה זה, לשנים הראשונות משתמשים ברגרסיה לוגיסטית או דומה. עבור סוג אחר של משתנים, הטכניקה הנפוצה ביותר היא רגרסיה לינארית.

דוגמה משתנה קטגורית

לסיום, בואו נסתכל על דוגמה נפוצה מאוד בשיווק. בואו נדמיין שאנחנו רוצים למכור מוצר ואנחנו מעוניינים לדעת את המצב המשפחתי.

לשם כך נקצה 1 לרווקה, 2 לנשואים, 3 לגרושים, 4 לשותף וחמישה לאחרים.

בואו נראה את התמונה ואז נגיב עליה:

אנו יכולים לראות כי האחוז הגבוה ביותר של יחידים הם רווקים, נשואים וגרושים, כאשר שתי האפשרויות האחרות הן רק 5%.

כפי שאנו רואים, משתנים קטגוריים שימושיים לקיבוץ. תרשים העמודים מאפשר לנו להתבונן טוב יותר באחוזים אלה, מכיוון שקל יותר להשוות את גודל הסורגים.