כריית נתונים - מה זה, הגדרה ומושג

תוכן העניינים:

כריית נתונים - מה זה, הגדרה ומושג
כריית נתונים - מה זה, הגדרה ומושג
Anonim

כריית נתונים היא תהליך של חיפוש בבסיסי נתונים גדולים כדי למצוא מידע שימושי שיכול לשמש לקבלת החלטות. משתמשים גם במונח באנגלית "כריית נתונים".

ניתן להבין זאת כטכנולוגיה ותוכנה המשמשים למציאת דפוסי התנהגות במסד הנתונים. הבסיס הבסיסי לכך הוא שדפוסים אלה מסייעים בקבלת החלטות. לדוגמה, זה יכול לעזור לחברות להבין את דפוסי ההתנהגות של הלקוחות שלהם. באופן זה יקל על קביעת אסטרטגיות להגדלת המכירות או להפחתת העלויות.

יתרונות כריית נתונים

היתרון הבסיסי בתהליך ניתוח נתונים זה הוא המספר הגדול של תרחישים עסקיים שאליהם ניתן ליישם אותו, כדוגמה שיש לנו:

  • נְבוּאָה: תחזית מכירות החברה.
  • הִסתַבְּרוּת: בחירת הלקוחות הטובים ביותר ליצירת קשר ישיר בטלפון או בדוא"ל.
  • ניתוח רצף: ניתוח המוצרים שהלקוחות קנו ובודק את יחסי הגומלין ביניהם.

שלבי כריית נתונים

בתהליך כריית נתונים אנו יכולים למצוא חמישה שלבים:

  • מטרה ואיסוף נתונים: הראשון מכל הוא להתמקד באיזה סוג מידע אנו רוצים להשיג. בואו נדמיין את הדוגמה שסופרמרקט רוצה לדעת מה השעה ביום בה הכי הרבה נוכחות לקוחות. זה יהיה המטרה והמידע שהסחר רוצה להשיג במקרה זה.
  • עיבוד וניהול נתונים: ברגע שנדע את הנתונים שאנו רוצים לאסוף, אנו מעבירים את הנתונים לעבודה. זה אולי השלב הקשה ביותר בתהליך. ובכן, זה דורש בחירת המדגם המייצג עליו הניתוח עומד להתבצע. לאחר שנבחר המדגם, יש לנתח איזה סוג של משתנים או מודל רגרסיה עומד להתבצע על המדגם.
  • בחירת מודל: זה קשור קשר הדוק לשלב הקודם. מדובר ביצירת מודל או אלגוריתם שנותן לנו את התוצאה הטובה ביותר האפשרית. לשם כך יש לבצע ניתוח ממצה של המשתנים שייכללו במודל. זו הופכת למשימה מסובכת מכיוון שהיא תלויה בסוג המידע שיש לנתח. לכן, כורי נתונים מבצעים בדיקות שונות של האלגוריתם כגון: רגרסיה לינארית, עץ החלטות, סדרות זמן, רשת עצבית וכו '.
  • ניתוח ובדיקת תוצאות: בעיקרון זה לנתח את התוצאות כדי לראות אם הן מניבות הסבר הגיוני. הסבר המאפשר קבלת החלטות על סמך המידע שמספק התוצאות.
  • עדכון המודל: השלב האחרון בתהליך יהיה עדכון המודל. חשוב מאוד שזה ייעשה לאורך זמן כדי שלא יתיישן. המשתנים של המודל עלולים להיות חסרי משמעות ולכן נדרשת שליטה תקופתית במודל.