מבחן קולמוגורוב - סמירנוף (K-S)

מבחן Kolmogorov-Smirnoff (K-S) הוא מבחן לא פרמטרי שמטרתו לקבוע אם התדירות של שתי ערכות נתונים שונות עוקבת אחר אותה התפלגות סביב הממוצע שלהן.

במילים אחרות, מבחן Kolmogorov-Smirnoff (K-S) הוא מבחן המתאים את עצמו לצורת הנתונים ומשמש לבדיקה אם שתי דוגמאות שונות עוקבות אחר אותה התפלגות.

מדוע מדובר בבדיקה לא פרמטרית?

היופי במאפיין "הלא פרמטרי" הוא בכך שהוא מתאים לנתונים וכתוצאה מכך להתפלגויות שיכולות לעקוב אחר תדירות הנתונים. בנוסף, תכונה זו חוסכת מאיתנו להניח מראש לאיזו תפוצה המדגם עוקב.

חשיבות מבחן ה- K-S

כמה פעמים קיבלנו שתי דגימות וחישבנו את מקדם המתאם של פירסון מבלי לחשוב פעמיים? במילים אחרות, אם אנחנו רוצים לראות את הקשר הליניארי בין שתי מערכי נתונים, זה יהיה הוגן לחשב את המתאם, נכון?

ניכוי זה יהיה נכון אם התפלגויות שתי הדגימות עוקבות אחר התפלגות נורמלית. מקדם המתאם מניח שההתפלגויות תקינות, אם נדלג על הנחה זו, התוצאה של מקדם המתאם שגויה. למבחני ההשערה ומרווחי הביטחון אנו מניחים גם כי האוכלוסייה מופצת באמצעות התפלגות נורמלית.

כמו כל מבחני ההשערה הכוללים סטטיסטיקה, חשוב שיהיה נפח גדול של נתונים כדי לקבל תוצאות משמעותיות סטטיסטית. אנו עלולים לדחות בטעות השערת אפס מכיוון שהמדגם קטן. יתר על כן, חשוב כי למדגם זה יהיו מקרים קיצוניים (חריגים, באנגלית) כדי לתת עקביות לתוצאת הבדיקה.

נוהל בדיקה

נוהל השלבים הבאים.

הַשׁעָרָה

השלב הראשון יהיה לבדוק אם לשתי הדוגמאות יש אותה התפלגות. לשם כך אנו מבצעים בדיקת השערה בהנחה שלשני הדגימות יש אותה התפלגות לעומת ההשערה האלטרנטיבית שהם שונים.

סטָטִיסטִי

אנו עובדים עם פונקציות ההפצה המצטברות של שתי דוגמאות, F₁(x) ו- F₂(איקס):

לא להיבהל! אנו מנתחים את הנוסחה הנ"ל בשלווה:

החלק החשוב של הנוסחה הוא סימן הבדל (-). אנו מחפשים הבדלים אנכיים בהתפלגויות. אז נפחית את שתי פונקציות ההפצה המצטברות.
ה מפעיל "מקסימום". אנו מעוניינים למצוא את ההבדל הגדול ביותר או המרבי כדי לראות עד כמה שתי ההפצות יכולות להיות שונות.
ה ערך מוחלט. אנו משתמשים בערך המוחלט כך שסדר המפעילים לא ישנה את התוצאה. במילים אחרות, לא משנה איזה F (x) מכיל את הסימן השלילי:

ערך קריטי

עבור דגימות גדולות יש קירוב לערך הקריטי עבור K-S שתלוי ברמת המשמעות (%):

איפה₁ ו- n₂ הם גודל המדגם עבור מדגם F.₁(x) ו- F₂(x) בהתאמה.

כמה ערכים קריטיים מחושבים:

כלל דחייה

אפליקציה

לעתים קרובות אנו רוצים לבדוק האם שתי התפלגויות שונות זו מזו כאשר אנו רוצים לבנות תרחישי חיזוי (אנו עובדים עם שתי דוגמאות) או כאשר אנו רוצים להעריך איזו תפוצה מתאימה ביותר לנתונים (אנו עובדים עם מדגם אחד בלבד).

מבחן קולמוגורוב - סמירנוף (K-S)

מדוע מדובר בבדיקה לא פרמטרית?

חשיבות מבחן ה- K-S

נוהל בדיקה

הַשׁעָרָה

סטָטִיסטִי

ערך קריטי

כלל דחייה

אפליקציה

רשום פופולרי

צוות עבודה - מה זה, הגדרה ומושג

Usufruct - מה זה, הגדרה ומושג

מערכת היורו - מה זה, הגדרה ומושג

רב ערוצי - מה זה, הגדרה ומושג

מאמרים למעלה

נכס מוחשי - מה זה, הגדרה ומושג

עודף - מה זה, הגדרה ומושג

Embargo - מה זה, הגדרה ומושג

מינוף - מה זה, הגדרה ומושג

כסף שחור - מה זה, הגדרה ומושג

פופולרי עבור החודש

תעשיה - מה זה, הגדרה ומשמעות

מדוע אף אחד לא מדבר על משבר אשראי?

חברת האם - מה זה, הגדרה ומושג

היפר-אינפלציה - מה זה, הגדרה ומושג

עץ החלטה - מה זה, הגדרה ומושג

מטריצת מיקום - מהי, הגדרה ומושג

קישור - מה זה, הגדרה ומושג

האולטימטום של פרידמן ל- DIA

למלחמת הסחר יכול להיות תאריך תפוגה

גורמי ייצור - מה זה, הגדרה ומושג

התמחות בעבודה

תהליך עבודה - מה זה, הגדרה ומושג

זרימת הכנסה מעגלית - מהי, הגדרה ומושג