دوره مقدمات داده‌کاوی (Data Mining) و یادگیری ماشین (Machine Learning)

تمرکز این دوره بر آشنایی مقدماتی با داده‌کاوی (data mining) و یادگیری ماشین (machine learning) است. به صورت انتزاعی با مباحث مختلف داده‌کاوی و کاربردهای آن آشنای می شویم. همچنین به معرفی انواع روش‌های داده‌کاوی به صورت کاربردی‌تر خواهیم پرداخت. سعی می‌کنیم با اصطلاحات مختلف این حوزه آشنا شویم و یک بررسی سطح بالا در داده‌کاوی و یادگیری ماشین (machine learning) در این دوره داشته باشیم. در این دوره کمتر به جزئیات پیاده‌سازی الگوریتم‌های مختلف و روش کار آن ها خواهیم پرداخت.

بعد از اتمام این دوره انتظار می‌رود که بتوانید با اصطلاحات و مفاهیم پایه داده‌کاوی و یادگیری ماشین آشنا شوید و تفاوت زیر حوزه‌های مختلف آن‌ها را درک کنید.

چهارچوب کلی این دوره از کتاب‌های زیر است (ترجمه فارسی برخی از این کتاب‌ها در بازار موجود است):
» کتاب داده‌کاوی، مفاهیم و تکنیک‌ها از هان
» کتاب داده‌کاوی از ویتن
» کتاب داده‌کاوی از آگراوان

ترتیب پیشنهادی ما برای خواند این دوره به صورت زیر است:

درس ۱داده‌کاوی (Data Mining) چیست؟
درس ۲یادگیری ماشین (Machine Learning) چیست؟
درس ۳تفاوت هوش مصنوعی، یادگیری ماشین، داده‌کاوی، یادگیری عمیق و علم داده
درس ۴طبقه‌بندی (Classification) و یادگیری نظارت شده (Supervised Learning) چیست؟
درس ۵خوشه‌بندی (Clustering) و یادگیری بدون ناظر (Unsupervised Learning) چیست؟
درس ۶تفاوت طبقه‌بندی (Classification) و خوشه‌بندی (Clustering)
درس ۷منظور از داده‌های آموزشی (Training Sets) در طبقه‌بندی چیست؟
درس ۸آشنایی با سیستم های توصیه گر (Recommendation Systems) و کاربردهای آن
درس ۹کاربرد داده‌کاوی و یادگیری ماشین در پردازش متن (Text Mining)
درس ۱۰معرفی چند نرم افزار کاربردی جهت داده‌کاوی
درس ۱۱ویژگی (Feature) یا همان بُعد (Dimension) در داده‌کاوی چیست؟
درس ۱۲بررسی چند الگوریتم یادگیری ماشین (Machine Learning)
درس ۱۳یادگیری دسته‌ای (Batch Learning) و یادگیری برخط (Online Learning)
درس ۱۴یادگیری فعال (Active Learning) در یادگیری ماشین
درس ۱۵انتخاب ویژگی (Feature Selection) چیست؟
درس ۱۶تفاوت داده ساختاریافته (Structured) یا غیرساختاریافته (Unstructured) چیست؟
درس ۱۷منظور از متغیر وابسته (Dependent) و مستقل (Independent)
درس ۱۸مجموعه داده‌هایی با ابعاد زیاد (High Dimensional)
درس ۱۹مجموعه داده‌ی نامتوازن (Imbalance) چیست؟
درس ۲۰فرآیند کریسپ (CRISP) جهت انجام پروژه‌های داده‌کاوی
درس ۲۱رانش یا گذار در داده‌ها (Data Drift)
این دوره در حال تکمیل است…