מקדם וריאציה - מהו, הגדרה ומשמעות
מקדם השונות, המכונה גם מקדם השונות של פירסון, הוא מדד סטטיסטי המודיע לנו על פיזור יחסי של מערך נתונים.
כלומר, הוא מודיע לנו, כמו מדדי פיזור אחרים, האם משתנה נע הרבה, מעט, פחות או יותר מאחר.
נוסחת מקדם הווריאציה
חישובו מתקבל על ידי חלוקת סטיית התקן לערך המוחלט של ממוצע הסט ובדרך כלל מתבטא באחוזים להבנה טובה יותר.

- איקס: משתנה שעליו יש לחשב את השונות
- σאיקס: סטיית תקן של משתנה X.
- | x̄ |: זה הממוצע של המשתנה X בערך מוחלט עם x̄ ≠ 0
ניתן לראות את מקדם הווריאציה באותיות CV או r, תלוי במדריך או בגופן בו משתמשים. הנוסחה שלה היא הבאה:
מקדם הווריאציה משמש להשוואת מערכי נתונים השייכים לאוכלוסיות שונות. אם נסתכל על הנוסחה שלו, נראה שזה לוקח בחשבון את ערך הממוצע. לכן מקדם הווריאציה מאפשר לנו למדוד פיזור שמבטל את העיוותים האפשריים של אמצעי שתי אוכלוסיות או יותר.
דַרגָהדוגמאות לשימוש במקדם הווריאציה במקום בסטיית התקן
להלן מספר דוגמאות למדד זה של פיזור:
השוואת מערכי נתונים בממדים שונים
אנו רוצים לקנות את הפיזור בין גובה 50 תלמידים בכיתה לבין משקלם. כדי להשוות את הגובה, נוכל להשתמש במטרים ובסנטימטרים כיחידת המידה ובקילוגרם למשקל. השוואה בין שתי ההתפלגויות הללו באמצעות סטיית התקן לא הגיונית מכיוון שאנו מנסים למדוד שני משתנים איכותיים שונים (מדד אורך ואחד ממסה).
השווה סטים עם הבדל גדול בין האמצעים
דמיין למשל שאנו רוצים למדוד את משקלם של החיפושיות וההיפופוטמים. משקלם של החיפושיות נמדד בגרמים או מיליגרם ומשקל ההיפופוטם נמדד בדרך כלל בטונות. אם למדידה שלנו נמיר את משקל החיפושיות לטונות כך ששתי האוכלוסיות יהיו באותו קנה מידה, שימוש בסטיית התקן כמדד לפיזור לא יהיה מתאים. משקל החיפושית הממוצע שנמדד בטונות יהיה כל כך קטן שאם נשתמש בסטיית התקן, כמעט ולא תהיה פיזור בנתונים. זו תהיה טעות מכיוון שהמשקל בין מינים שונים של חיפושית יכול להשתנות במידה ניכרת.
דוגמא לחישוב מקדם הווריאציה
קחו בחשבון אוכלוסיית פילים ואחרת של עכברים. לאוכלוסיית הפילים משקל ממוצע של 5,000 קילוגרם וסטיית תקן של 400 קילוגרמים. לאוכלוסיית העכברים משקל ממוצע של 15 גרם וסטיית תקן של 5 גרם. אם נשווה את פיזור שתי האוכלוסיות באמצעות סטיית התקן, אנו עשויים לחשוב שיש פיזור גדול יותר לאוכלוסיית הפילים מאשר לזו של עכברים.
עם זאת, בעת חישוב מקדם השונות לשתי האוכלוסיות, היינו מבינים שזה בדיוק ההפך.
פילים: 400/5000 = 0.08
עכברים: 5/15 = 0.33
אם מכפילים את שני הנתונים ב- 100, יש לנו שמקדם השונות של הפילים הוא 8% בלבד, בעוד שעכברים הוא 33%. כתוצאה מההבדל בין האוכלוסיות ומשקלן הממוצע אנו רואים כי האוכלוסייה עם הפיזור הגדול ביותר אינה זו עם סטיית התקן הגדולה ביותר.
מרווח ביטחוןמקדם מתאם לינארי