טאו של קנדל (II) - מה זה, הגדרה ומושג

זהו מדד תלות שאינו פרמטרי המזהה את הזוגות הקונקורדנטיים והנבדלים של שני משתנים. לאחר הזיהוי מחושבים הסיכומים ומבצעים את המנה.

במילים אחרות, אנו מקצים דירוג לתצפיות של כל משתנה ונחקר את יחסי התלות בין שני משתנים נתונים.

ישנן שתי דרכים לחישוב הטאו של קנדל; אנו בוחרים לחשב את יחסי התלות לאחר שההתצפיות של כל משתנה הוזמנו. בדוגמה שלנו נראה שנמיין את הדירוג בעמודה X בסדר עולה.

מתאמים מסווגים הם חלופה לא פרמטרית כמדד לתלות בין שני משתנים כאשר איננו יכולים להחיל את מקדם המתאם של פירסון.

אלו התוצאות שהפנו אלינו במאמר הראשון -> טאו של קנדל (I):

אתר סקי (אני) איקס ז ג NC
ל 1 1 6 0
ב 2 3 5 0
ג 3 4 5 1
ד 4 2 4 0
AND 5 7 4 1
F 6 6 4 1
ז 7 5 43 3 סך הכל
  • צמד BC-CB הוא צמד דיסקורדי. אנו נכנסים 1 בעמודה NC ומקפיאים את המונה במצב האחרון עד שנמצא שוב זוג תואם. במקרה זה, הקפאנו את מספר הזוגות התואמים ב -5 עד לתחנה D. תחנה D יכולה ליצור רק 4 זוגות תואמים: AD-DA, DE-ED, DF-FD, DG-GD.

זוג אחר לא מסודר יהיה EF-FE:

  • הצמד EF-FE הוא זוג דיסורדנטי. אנו כותבים 1 בעמודה NC וממשיכים לגרור את מספר 4 הזוגות התואמים שניתן ליצור. הזוגות התואמים של תחנה E יהיו: EA-AE, EB-BE, EC-CE, ED-DE מכיוון ש- EF-FE אינו מתאים.
    • הצמד FG-GF הוא זוג לא מתאים. אנו כותבים 1 בעמודה NC וממשיכים לגרור את מספר 4 הזוגות התואמים שניתן ליצור. הזוגות הקונקורדנטיים של התחנה F s (לא גיוונו את המקום במקום 4. הזוגות הקונקורדנטיים שהיינו יכולים להראות לפני כן (לא שינינו את זה יהיו: FA-AF, FB-BF, FC-CF, FD-DF כי FG-GF צורם.

אנו מחשבים את הטאו של קנדל

לטאו של קנדל אין שום סוד מעבר להיותו המרכיב של הזוגות הקונקורדנטיים והנבדלים ממדגם של תצפיות.

פרשנות

השאלה הראשונית שלנו הייתה: האם קיים קשר תלות בין העדפות גולשים במורד הגולש לבין גולשים נורדיים באתרי סקי נתונים?

במקרה זה, יש לנו תלות בין שני המשתנים של 0.8695. תוצאה קרובה מאוד לגבול העליון. תוצאה זו מספרת לנו כי גולשי הגולן (X) והגולשים הנורדיים (Z) סיווגו את אתרי הנופש בסיווגים דומים.

מבלי לעשות כל סוג של חישוב, אנו יכולים לראות כי התחנות הראשונות (A, B, C) זוכות לציונים הטובים ביותר משתי הקבוצות. במילים אחרות, דירוג הגולשים הולך באותו כיוון.

השוואה: פירסון מול קנדל

אם נחשב את מקדם המתאם של פירסון בהתחשב בתצפיות הקודמות ונשווה אותו לטאו של קנדל, נקבל:

במקרה זה, התאו של קנדל אומר לנו שקיים קשר תלות חזק יותר בין המשתנים X ו- Z בהשוואה למקדם המתאם של פירסון: 0.8695> 0.75.

אם לחריגים הייתה השפעה רבה על התוצאות, היינו מוצאים הבדל גדול בין פירסון לספרמן, ולכן עלינו להשתמש בספרמן כמדד לתלות.