סימן סטטיסטי - מה זה, הגדרה ומושג

תוכן העניינים:

סימן סטטיסטי - מה זה, הגדרה ומושג
סימן סטטיסטי - מה זה, הגדרה ומושג
Anonim

מדגם סטטיסטי הוא קבוצת משנה של נתונים השייכת לאוכלוסיית נתונים. מבחינה סטטיסטית, זה חייב להיות מורכב ממספר תצפיות מסוים המייצג כראוי את סך הנתונים.

הסטטיסטיקה, כענף במתמטיקה, אחראית על איסוף הנתונים, סדרם וניתוחם. במילים אחרות, כאשר אנו רוצים לחקור תופעה מסוימת אנו פונים לסטטיסטיקה. דוגמה טובה לתופעה שנחקרת על ידי סטטיסטיקה היא השכר הממוצע של אזרחי המדינה

במובן זה, מטעמי זמן ועלות, איננו יכולים לאסוף את כל הנתונים. מכלול הנתונים הזה הוא מה שמכונה אוכלוסיית נתונים או פשוט אוכלוסייה.

מדוע אתה עובד עם מדגמים סטטיסטיים?

כדי להסביר מדוע משתמשים במדגם סטטיסטי במקום באוכלוסייה הכוללת, נשתמש בדוגמה שהועלתה לעיל.

נניח שאנחנו רוצים לחקור כל תופעה. במקרה שלנו, תופעה זו היא השכר הממוצע של אזרחי המדינה. אוכלוסיית הנתונים מורכבת מכל עובד ועובד במדינה. כמובן שמטעמים של זמן ועלות, אי אפשר יהיה לשאול כל עובד מה המשכורת השנתית שלו. זה ייקח הרבה זמן או שנצטרך הרבה משאבים.

בשלב זה מופיע המושג מדגם סטטיסטי. במקום לשאול את מיליוני העובדים במדינה או באזור, אנו אוספים רק כמות קטנה של נתונים. לדוגמא, שאלנו 100,000 איש. משימה זו עדיין מסובכת, אך משתלם יותר לשאול 100 אלף איש מאשר לשאול 30 מיליון.

כמות הנתונים הקטנה הזו חייבת להיות מייצגת. כלומר, עליו לייצג כראוי את האוכלוסייה. אם 100 אלף האנשים ששאלנו יתרכזו בשכונות עשירות, נקבל נתונים שאינם מייצגים. השכר הממוצע יהיה גבוה בהרבה ממה שהוא באמת.

מאפייני מדגם סטטיסטי מייצג

אם ברצונך לבצע מחקר טוב, איכות המדגם הסטטיסטי חיונית. אין תועלת לבצע את המדדים הסטטיסטיים המורכבים ביותר עם המודלים המתוחכמים ביותר אם המדגם הסטטיסטי מוטה. כלומר, אם המדגם אינו מייצג.

בעת קבלת מדגם מייצג ישנם היבטים מסוימים שעל החוקר לדעת מראש. בין ההיבטים הללו ניתן למנות את המאפיינים של מדגם מייצג. המאפיינים של מדגם מייצג הם כדלקמן:

  • גודל מספיק גדול: כשאנחנו עובדים עם דוגמאות אנחנו בדרך כלל עובדים עם כמות נתונים קטנה מהאוכלוסייה. עם זאת, כדי שמדגם סטטיסטי יהיה מייצג, עליו להיות גדול מספיק כדי להיחשב כמייצג. לדוגמא, אם האוכלוסייה שלנו מורכבת מעשרה מיליון נתונים ואנחנו בוחרים 10, קשה לה להיות ייצוגית. כמובן שככל שהמדגם לא תמיד יותר מייצג.
  • אקראיות: בחירת הנתונים ממדגם סטטיסטי חייבת להיות אקראית. כלומר, זה חייב להיות אקראי לחלוטין. אם במקום לעשות זאת באופן אקראי, אנו מבצעים תהליך בחירת נתונים מתוכנן, אנו מכניסים הטיה לאיסוף הנתונים. לכן, כדי להימנע מהמדגם מוטה ולכן, כדי להפוך אותו למדגם מייצג, עלינו לבצע בחירה אקראית.

מסקנה סטטיסטית

לאחר שהושג יש לנו את המדגם המייצג, אז יש צורך להסיק מדדים מסוימים. לעתים קרובות אנו מעוניינים לדעת מידה מסוימת של משתנה. בדוגמה הראשונית, המשתנה יהיה משכורתם של אזרחי המדינה. במובן זה, המדד אותו אנו רוצים לנתח הוא המשכורת הממוצעת של אזרחי מדינה.

במילים אחרות, יש לנו אוכלוסיית נתונים המורכבת מכלל העובדים במקסיקו. מאוכלוסייה זו אנו מקבלים משתנה, כלומר השכר השנתי. בעזרת הטכניקות המתאימות אנו מקבלים מדגם מייצג. ולבסוף, ברגע שיש לנו מערך נתונים שנוכל לעבוד איתו, אנו משתמשים בטכניקות הסקה סטטיסטיות כדי לחשב את המשכורת הממוצעת.

כמובן שברגע שיש לנו את מערך הנתונים, נוכל להסיק צעדים אחרים. לדוגמא, כיצד חלוקת המשכורת, אחוז העובדים מתחת לשכר מסוים או כמה גדול פער השכר.

דוגמא לדוגמא סטטיסטית

נניח שאנחנו רוצים לבצע מחקר על ההוצאה הממוצעת של משפחות קולומביאניות בחודש ינואר. לשם כך יש לנו שתי אפשרויות:

  1. הזן את חשבונות הבנק של כל המשפחות בקולומביה
  2. שאל מספר אנשים מייצג

האפשרות הראשונה אינה בת קיימא מכמה סיבות. ראשית, שהמשפחות לא מתכוונות לוותר על הנתונים שלהם ושנית שלא נוכל ללכת משפחה לפי משפחה להסתכל גם על הנתונים. בעיקר מכיוון שאוכלוסיית קולומביה קרובה ל -50 מיליון. בינתיים, השנייה היא האפשרות לאסוף מדגם סטטיסטי.

מה שאנחנו נעשה, בהתאם למאפיינים שהוזכרו לעיל, יהיה לשאול 100,000 משפחות. זה קצת מסובך אבל הרבה יותר קל מאשר לשאול 50 מיליון קולומביאנים. ההבדל ניכר. לפיכך, בהתבסס על מדגם זה של 100,000 משפחות, ננסה לחשב את ההוצאה הממוצעת של המשפחות בינואר.

הנתונים המופקים יהיו אמינים פחות או יותר על פי סדרת מדדים הנלקחים בחשבון בחקירות סטטיסטיות. כמובן, סוגים אלה של מדדים הם מתקדמים יותר, ולכן לא נדון בהם כאן.