Variancia - מה זה, הגדרה ומשמעות

תוכן העניינים:

Anonim

שונות היא מדד לפיזור המייצג את השונות של סדרת נתונים ביחס לממוצע שלה. באופן רשמי, הוא מחושב כסכום השאריות בריבוע חלקי סך התצפיות.

ניתן לחשב את זה גם כסטיית התקן בריבוע. אגב, אנו מבינים את השיורי כהפרש בין ערך המשתנה בכל פעם לבין הערך הממוצע של המשתנה כולו.

ראה את כל מדדי הפיזור

לפני שנסתכל על נוסחת השונות, עלינו לומר שהשונות בסטטיסטיקה חשובה מאוד. מכיוון שלמרות שמדובר במדד פשוט, הוא יכול לספק מידע רב על משתנה ספציפי.

נוסחה לחישוב השונות

יחידת המדידה של השונות תהיה תמיד יחידת המדידה המתאימה לנתונים אך בריבוע. השונות תמיד גדולה או שווה לאפס. מכיוון שהשאריות בריבוע, זה בלתי אפשרי מבחינה מתמטית שהשונות תצא שלילית. וככה זה לא יכול להיות פחות מאפס.

איפה

  • איקס: משתנה שעליו יש לחשב את השונות
  • איקסאני: מספר תצפית i של משתנה X. אני יכול לקחת ערכים בין 1 ל- n.
  • n: מספר תצפיות.
  • איקס: זהו הממוצע של המשתנה X.

או מה זהה:

מדוע השאריות בריבוע?

הסיבה שהשאריות בריבוע היא פשוטה. אם הם לא היו בריבוע, סכום השאריות יהיה אפס. זהו רכוש של פסולת. אז כדי להימנע מכך, כמו עם סטיית התקן, הם בריבוע. התוצאה היא יחידת המידה בה הנתונים נמדדים אך בריבוע.

לדוגמא, אם היו לנו נתונים על שכרם של קבוצה של אנשים ביורו, הנתונים שנותנים את השונות יהיו ביורו רבוע. כדי שהפרשנות תהיה הגיונית, היינו מחשבים את סטיית התקן ומעבירים את הנתונים ליורו.

  1. סטייה -> (2-3) = -1
  2. סטייה -> (4-3) = 1
  3. סטייה -> (2-3) = -1
  4. סטייה -> (4-3) = 1
  5. סטייה -> (2-3) = -1
  6. סטייה -> (4-3) = 1

אם נוסיף את כל הסטיות התוצאה היא אפס.

דַרגָה

מה ההבדל בין השונות לסטיית התקן?

שאלה אחת שאפשר לשאול, ומסיבה טובה, תהיה ההבדל בין שונות לסטיית תקן. במציאות הם באים למדוד את אותו הדבר. השונות היא סטיית התקן בריבוע. או להיפך, סטיית התקן היא שורש הריבוע של השונות.

סטיית התקן נעשית על מנת שתוכל לעבוד ביחידות המידה הראשוניות. כמובן שכרגיל, אפשר לתהות, מה התועלת בכך שיש שונות כמושג? ובכן, למרות שפירוש הערך שהוא מחזיר אינו נותן לנו מידע רב, חישובו נחוץ בכדי להשיג את הערך של פרמטרים אחרים.

כדי לחשב את המשתנות אנו זקוקים לשונות ולא לסטיית התקן, כדי לחשב כמה מטריצות אקונומטריות משתמשים בשונות ולא בסטיית התקן. זה עניין של נוחות כשעובדים עם הנתונים לפי אילו חישובים.

דוגמא לחישוב שונות

אנו הולכים למטבע סדרת נתונים על השכר. יש לנו חמישה אנשים, כל אחד עם משכורת שונה:

חואן: 1,500 יורו

פפה: 1,200 יורו

חוסה: 1,700 יורו

מיגל: 1,300 יורו

מטאו: 1,800 יורו

המשכורת הממוצעת, שאנו זקוקים לה לצורך חישובנו, היא ((1,500 + 1,200 + 1,700 + 1,300 + 1,800) / 5) 1,500 אירו.

מאחר שנוסחת השונות בצורתה המפורקת מנוסחת באופן הבא:

נקבל כי יש לחשב כך:

התוצאה היא 52,000 יורו בריבוע. חשוב לזכור שבכל פעם שאנחנו מחשבים את השונות יש לנו את יחידות המדידה בריבוע. כדי להמיר אותו ליורו, במקרה זה נצטרך לבצע את סטיית התקן. התוצאה המשוערת תהיה 228 אירו. המשמעות היא שבממוצע ההפרש בין משכורות האנשים השונים יהיה 228 אירו.