נתון מספיק - מה זה, הגדרה ומושג

תוכן העניינים:

Anonim

נתון מספיק לפרמטר Θ הוא מסוגל לאסוף או לסכם את כל המידע שהמדגם של משתנה אקראי X מכיל.

אנו יודעים כי נתון הוא פונקציה אמיתית של המדגם. כלומר, יש צורך בערכים אמיתיים הכלולים במדגם. משם, כפי שראינו במאמר בו מוגדר מושג הסטטיסטיקה, עלינו לוודא כי לסטטיסטיקאי תכונות מסוימות. מדוע לדרוש נכסים כאלה? כדי להבטיח שהסטטיסטיקה שימושית למטרות שלנו.

הספקות היא אחד מאותם תכונות. בצורה הרבה יותר פשוטה, אנו אומרים כי נתון מספיק אם הוא משתמש בכל המידע הכלול במדגם.

איך לדעת אם מספיק נתון?

מבחינה לוגית, השאלה המתעוררת היא: כיצד אוכל לדעת אם נתון T ממלא את מאפיין הספיקות? או איך אוכל למצוא, אם קיים, נתון הממלא את מאפיין הספיקות. התשובה לשתי שאלות אלו מצויה בשני משפטים:

  • קריטריון פקטורציה של פישר-ניימן: קריטריון זה קובע כי בהינתן נתון T, אם הוא עומד בתנאים מסוימים, יהיה זה נתון מספיק.
  • משפט דרמואה: משפט זה עונה על השאלה השנייה. כלומר, זה מאפשר לנו למצוא סטטיסטיקה מספקת באמצעות סדרת נהלים.

דוגמה לנתון מספיק

נניח שאנחנו רוצים לחשב את ההכנסה השנתית הממוצעת של משפחות המתגוררות בצ'ילה. לשם כך, נעקוב אחר התהליך הבא:

  1. איסוף מידע (מדגם): מכיוון שאיננו יכולים לשאול כל אחת מהמשפחות המתגוררות בצ'ילה כמה הם מרוויחים מדי שנה, ניקח מדגם מייצג של, למשל, 1,000 משפחות.
  2. זהה את המשתנה האקראי הנחקר: המשתנה האקראי הנחקר הוא הכנסה משפחתית. כך: X → הכנסה משפחתית
  3. בחר את הנתון הנכון: הנתון המתאים לחישוב הכנסה ממוצעת הוא לא אחר מאשר הציפייה ל- X. במילים אחרות, ממוצע המדגם של X.
  4. כיצד אוכל לדעת אם נתון המדגם הוא נתון מספיק? כפי שכבר יש לנו את הביטוי המתמטי של הנתון, נשתמש בקריטריון הפקטור של פישר-ניימן. או, משפט הדרמואה. הם נוסחאות שנוצרו למטרה זו.

לאחר יישום החישובים הנכונים, אנו מסיקים כי נתון המשמעות של המדגם עומד בדרישה או בתכונת הסיפוק. על ידי הבטחת עמידה בדרישה זו, אנו מבטיחים כי פונקציה (סטטיסטית) זו, המאפשרת לנו לסנתז את המידע (ההכנסה הממוצעת), תשתמש בכל המידע הכלול במדגם (1,000 המשפחות).

מדוע חשוב שאשתמש בכל המידע שבמדגם?

עכשיו, כשאנחנו יודעים שממוצע המדגם הוא נתון מספיק, נניח מקרה. איזו היגיון יהיה לרצות לחשב את ההכנסה הממוצעת על סמך 1,000 המשפחות הצ'יליאניות וכי אנו משתמשים רק בנתונים של 500 משפחות?

כמובן, זה לא היה הגיוני. אנו רוצים סיכום של כל המידע. כלומר, מה שהגדרנו כנתון מספיק.