מקדם קביעה (R בריבוע)

תוכן העניינים:

מקדם קביעה (R בריבוע)
מקדם קביעה (R בריבוע)
Anonim

מקדם הקביעה הוא הפרופורציה של השונות הכוללת של המשתנה המוסברת על ידי הרגרסיה. מקדם הקביעה, הנקרא גם R בריבוע, משקף את טובת ההתאמה של מודל למשתנה שהוא מתכוון להסביר.

חשוב לדעת כי תוצאת מקדם הקביעה מתנודדת בין 0 ל -1. ככל שערכו קרוב יותר ל- 1, כך ההתאמה של המודל למשתנה שאנחנו מנסים להסביר גדולה יותר. לעומת זאת, ככל שהמודל יהיה קרוב יותר לאפס, כך הדגם יהיה פחות מהודק, ולכן הוא יהיה פחות אמין.

בביטוי הקודם יש לנו שבר. אז בואו נעבור לפי חלקים. ראשית, ננתח את המונה, כלומר את החלק העליון.

למי שלא מכיר את ביטוי השונות, אני ממליץ לך לקרוא את המאמר בנושא. עבור מי שכן יודע זאת, הם אולי מבינים שזה ביטוי השונות, אך עם שני הבדלים מהותיים.

ההבדל הראשון הוא שיש ל- Y סיבוב או מה שמורים מכנים בצורה דיקטית "כובע". מה שאותו כובע מפרט הוא ש- Y הוא האומדן של מודל של מה על פי המשתנים המסבירים שווה Y, אבל זה לא הערך האמיתי של Y, אלא אומדן של Y.

שנית, יהיה צורך לחלק את T. אשר, במקרים אחרים, מצוין כ- N או כמספר תצפיות. עם זאת, מכיוון שנוסחת המכנה תישא גם אותה, אנו מסירים את המכנים (למטה) משתי הנוסחאות כדי לפשט את הביטוי. בדרך זו קל יותר לעבוד איתו.

בשלב הבא אנו הולכים לבצע את אותה ניתוח עם החלק המכנה (החלק התחתון).

במקרה זה, ההבדל היחיד מנוסחת השונות המקורית הוא היעדר המכנה שלה. כלומר, אנו לא מתחלקים ב- T או N. בדרך זו, לאחר שהוסברו שני חלקי הביטוי הגנרי של ה- R בריבוע או מקדם הנחישות, אנו הולכים לראות דוגמה.

מקדם וריאציהמקדם מתאם לינאריניתוח רגרסיה

פירוש מקדם הקביעה

נניח ואנחנו רוצים להסביר את מספר השערים שכובש כריסטיאנו רונאלדו על סמך מספר המשחקים שהוא משחק. אנו מניחים שככל שישחקו יותר משחקים הוא יבקיע יותר שערים. הנתונים נוגעים לשמונה העונות האחרונות. לפיכך, לאחר חילוץ הנתונים, המודל מניב את ההערכה הבאה:

כפי שניתן לראות מהגרף, הקשר חיובי. ככל שמשחקים יותר משחקים, כמובן, כך הוא מבקיע יותר שערים בעונה. ההתאמה, על סמך החישוב בריבוע R, היא 0.835. המשמעות היא שמדובר במודל שההערכות שלו מתאימות די טוב למשתנה האמיתי. למרות שטכנית זה לא יהיה נכון, נוכל לומר משהו כזה המודל מסביר 83.5% מהמשתנה האמיתי.

מקדם הקביעה

הבעיה של מקדם הקביעה, והסיבה לכך שמקדם הקביעה המתואם מתעורר, היא שהיא אינה מענישה הכללה של משתני הסבר שאינם משמעותיים. כלומר, אם למודל יתווספו חמישה משתני הסבר הנושאים מעט קשר לשערים שכובש כריסטיאנו רונאלדו בעונה, הריבוע R יגדל. לכן מומחים כלכליים, סטטיסטיים ומתמטיים רבים מתנגדים לשימוש ב- R בריבוע כמדד מייצג לטובת ההתאמה האמיתית.

מקדם הקביעה המותאם

מקדם הקביעה המתואם (מותאם R בריבוע) הוא המדד המגדיר את האחוז המוסבר על ידי השונות של הרגרסיה ביחס לשונות של המשתנה המוסבר. כלומר, זהה ל- R בריבוע, אך עם הבדל: מקדם הקביעה המותאם מעניש את הכללת המשתנים.

כפי שאמרנו קודם, מקדם הקביעה של מודל עולה גם אם המשתנים שאנו כוללים אינם רלוונטיים. מכיוון שזו בעיה, כדי לנסות לפתור אותה, הריבוע R המותאם הוא כזה ש:

בנוסחה, N הוא גודל המדגם ו- k הוא מספר המשתנים המסבירים. על ידי ניכוי מתמטי, ככל שהערכים הגבוהים יותר של k, ככל שה- R בריבוע המתואם יהיה יותר מה- R בריבוע הרגיל. לעומת זאת, בערכים נמוכים יותר של k, ככל שהחלק המרכזי יהיה קרוב יותר ל -1 ולכן, ה- R בריבוע המותאם והריבוע ה- R הרגיל יהיו דומים יותר.

כשאנחנו זוכרים ש- k הוא מספר המשתנים המסבירים, אנו מסיקים שזה לא יכול להיות אפס. אם זה היה אפס, לא היה שום דגם. לכל הפחות, נצטרך להסביר משתנה אחד במונחים של משתנה אחר. מכיוון ש- k חייב להיות לפחות 1, R- בריבוע המותאם ו- R בריבוע הרגיל לא יכולים להיות בעלי אותו ערך. יתר על כן, ה- R בריבוע המותאם תמיד יהיה פחות מה- R בריבוע הרגיל.