داده کاوی(Data mining) چیست؟

تعریف تئوری: داده کاوی فرآیند تبدیل یک سری داده به یک سری دانش توسط فرآیندهای مختلف است.

تعریف تجربی:

با یک مثال شروع میکنیم. فرض کنید شما مدیر یک بانک هستید. و میخواهید از بین ۱۰۰۰۰۰مشتری که متقاضی وام هستند، به ۱۰۰۰نفر وام دهید. پس لازم است که از بین این ۱۰۰۰۰۰نفر، ۱۰۰۰نفری را انتخاب کنید که اطمینان بیشتری برای برگرداندن وام دارند.

در فرآیند داده کاوی، ابتدا مدیر بانک بایستی یک سری از افراد(مثلا ۲۰۰نفر) را به عنوان افراد مطمئن و ۲۰۰ نفر دیگر را به عنوان افراد غیر مطمئن برای سیستم مشخص کند.

اینجاست که داده کاوی وارد عمل میشود، و ۲۰۰فرد مورد اطمینان و ۲۰۰فرد غیر مطمئن، را مشاهده کرده و الگوهای رفتاری این افراد را مورد بررسی قرار می دهد. در واقع سیستم متوجه می شود که چه الگوی رفتاری ای، منجر به اطمینان و چه الگویی منجر به عدم اطمینان می شود. در اینجاست که سیستم، یاد میگیرد(learn) و میتواند بین افراد مطمئن و غیرمطمئن تمیز قائل شود.

حال این سیستم که فرآیند را یادگرفته است، میتواند هر مشتری دیگری را نیز، در دسته مطمئن ها و غیر مطمئن ها، تقسیم کند. اینجاست، که تمامی ۱۰۰۰۰۰نفر را به سیستم وارد میکنیم و خروجی این سیستم، میتواند تعداد افرادی را مشخص کند که مطمئن هستند و میتوان به آن ها وام داد.

این یک مثال، از داده کاوی بود، که به یادگیری نظارت شده نیز معروف است. در این جا، ناظر(همان مدیر بانک) یک مجموعه ی کم از داده ها را برای سیستم، به اصطلاح برچسب زد. یعنی مشخص کرد که کدام مشتری مطمئن و کدام مشتری نامطمئن است.

همان طور که مشاهده میکنید، یک از یک مجموعه داده(مشتری های بانک)، به یک سری دانش(به چه شخصی وام بدهیم به چه شخصی خیر) رسیدیم.

علم داده کاوی، بسیار گسترده تر از بحث مثال اینجاست. یادگیری غیرنظارت شده(خوشه بندی) یا clustering، قواعد وابستگی و… نیز زیر دسته های علم داده کاوی هستند، که از فرآیند های داده کاوی استفاده می کنند.

منابع این بحث و اطلاعات بیشتر
در صورت تمایل به یادگیری بیشتر، منابع بالا در نظر گرفته شده است. می توانید با خواندن این منابع، به یادگیری خود در این زمینه عمق ببخشید

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *