נורמליזציה סטטיסטית - מה זה, הגדרה ומושג

תוכן העניינים

נורמליזציה סטטיסטית היא הטרנספורמציה בקנה מידה של התפלגות המשתנה על מנת שתוכל לבצע השוואות ביחס לקבוצות אלמנטים ולממוצע על ידי ביטול השפעות ההשפעות.

במילים אחרות, נורמליזציה היא פרופורציות ללא יחידות מדידה (חסרות ממד או קבוע בקנה מידה) המאפשרות לנו להשוות אלמנטים של משתנים שונים ויחידות מדידה שונות.

בסטטיסטיקה ובאקונומטריה משתמשים בטבלאות התפלגות הסתברות סטנדרטיות כדי למצוא את ההסתברות שתצפית נוקטת בהתחשב בפונקציית ההתפלגות שהמשתנה עוקב אחר.

חשוב לא להגביל את מונח הנורמליזציה רק ​​לקבוצות של אלמנטים שבהם ההתפלגות הנורמלית היא קירוב טוב לתדירות שלהם.

משתנה סטטיסטי

שולחן

הטבלה הבאה מפרטת את הסטנדרטיזציות הנפוצות ביותר בסטטיסטיקה החלה על מימון וכלכלה.

  • הציון המאופיין או הסטנדרטי מנרמל את השגיאות כאשר אנו יכולים לחשב את הפרמטרים לדוגמא.
  • הנורמליזציה בהתפלגות t של התלמיד מנרמלת את השאריות כאשר הפרמטרים אינם ידועים ואנחנו מעריכים להשיג אותם.
  • מקדם הווריאציה משתמש בממוצע כמדד קנה מידה, בניגוד לציון הסטנדרטי ו- t של הסטודנט, המשתמשים בסטיית התקן. ההתפלגות מנורמלת עבור הפיזות והפצות מעריכיות.
  • ניתן להחיל את הרגע הסטנדרטי על כל התפלגות הסתברות שיש לה פונקציה מייצרת רגע. במילים אחרות, כי האינטגרלים של הרגעים מתכנסים.

יישומים

כמה פעמים קראנו שהתפלגות ההסתברות הרגילה נראית כקירוב מספיק טוב לתדירות התצפיות ואנחנו מתבקשים למצוא את ההסתברות שהמשתנה X לוקח ערך ספציפי?

במילים אחרות, קבענו X ~ N (μ, σ2), ואנו מתבקשים למצוא את P (X ≤ xאני)

אנו יודעים שכדי למצוא P (X ≤ xאני), עלינו לחפש את ההסתברות בטבלאות חלוקת ההסתברות. במקרה זה, בטבלאות התפלגות ההתפלגות הנורמלית. טבלאות חלוקת ההסתברות הנפוצות ביותר באקונומטריקה ובמימון כמותי הן: ריבועי צ'י, סטודנט, פ 'פישר-סנדקור, F, פואיסון, אקספוננציאלי, קושי, והנורמלי הסטנדרטי.

ההסתברויות המחושבות בטבלאות החלוקה ממלאות את המאפיין:

כלומר ההסתברויות (המספרים בתוך הטבלה) מאופיינות. לאחר מכן, נצטרך להקליד את המשתנה שלנו בהתאם לפרמטרים של פונקציית ההתפלגות אם אנו רוצים למצוא את ההסתברות ל- P (X ≤ xאני).

דוגמא מעשית

אנו רוצים לדעת את ההסתברות שמספר הגולשים שיגלשו ביום שישי בבוקר הוא 288.

אתר הסקי אומר לנו שתדירות משתנה הגולשים יכולה להתקרב להתפלגות נורמלית של ממוצע 280 ושונות 16.

אז יש לנו:

X ~ N (μ, σ2)

כאשר X מוגדר כמשתנה 'גולשים'

הם מבקשים מאיתנו את ההסתברות שמספר הגולשים שיצאו לסקי ביום שישי יהיה פחות או יותר מ 288. כלומר:

P (X ≤ 288)

תהליך

כדי למצוא את ההסתברות שמספר הגולשים שווה ל 288, ראשית עלינו להקליד את המשתנה.

לאחר מכן אנו מסתכלים על טבלת החלוקה של התקן הרגיל הרציף:

ז 0 1 2 3
2,0 0,9772 0,9778 0,9783 0,9788

ההסתברות ש 288 גולשים יעברו סקי ביום שישי בבוקר היא 97.72% בהתחשב בפרמטרים הממוצעים והשונות.

תוכל לעזור בפיתוח האתר, שיתוף הדף עם החברים שלך

wave wave wave wave wave