آموزش مقدماتی داده‌کاوی (طبقه‌بندی) با پایتون و Scikit Learn

مدرس: مسعود کاویانی

در این کتابچه قصد داریم کسانی که به تازگی به جمع متخصصان علوم داده پیوسته اند را به صورت کاربردی با مباحث داده‌کاوی آشنا کنیم. از آن جایی که علم داده و داده‌کاوی بسیار گسترده است، در این کتابچه تمرکز خود را بر روی یکی از اصلی ترین زیر شاخه ها داده‌کاوی قرار میدهیم.

همان طور که میدانید یکی از زیر شاخه های اصلی و بسیار پرکاربرد داده‌کاوی، بحث طبقه‌بندی است. با استفاده از طبقه‌بندی میتوان الگوهای مختلف موجود در داده ها را فراگرفت. مثلا میتوانید تصویر یک دست نوشته را به صورت خودکار تشخیص داده و یا به صورت خودکار محتواهای مختلف نظرات کاربران یک وب سایت را به دسته های مثبت و منفی (از روی نوشته) تقسیم بندی کنید (که به آن تحیلی احساس یا Sentiment Analyse میگویند). کاربردهای طبقه‌بندی در بسیاری از کسب و کارها و استارت آپ های جهان مانند گوگل بر کسی پوشیده نیست.

190,000 ریال – خرید آموزش

<< اگر مشکلی در خرید دارید میتوانید از طریق صفحه تماس با ما پیام خود را ارسال کنید >>

توضیحات تکمیلی:

در این کتابچه PDF آموزشی سعی داریم مقدماتی ساده شده از بحث طبقه‌بندی را با یکدیگر یاد بگیریم. برای این کار، از زبان برنامه نویسی پایتون که یکی از معتبرترین زبان ها در حوزه داده‌کاوی و یادگیری ماشین است استفاده میکنیم. همچنین جهت پیاده سازی طبقه‌بندی از کتابخانه Scikit Learn که یکی از کتابخانه ها مطرح این حوزه است کمک میگیریم.

محتوای کلی آموزشی این درس به صورت زیر است:

» آموزش مقدمات ورود به علوم داده و داده‌کاوی

» طبقه‌بندی چیست و چه تفاوتی با رگرسیون دارد؟

» چگونه با استفاده از کتابخانه Pandas داده ها را از فایل CSV بخوانیم؟

» چگونه با استفاده از Numpy آرایه ها و ماتریس های مخصوص این کتابخانه را بسازیم و آن را آماده عملیات داده‌کاوی برای کتابخانه Scikit Learn کنیم؟

» ساخت یک طبقه بند ساده همراه با مثال واقعی گل های IRIS

» نحوه ساخت و بازیابی مدل های یادگرفته شده توسط الگوریتم

» آشنایی با طبقه بند K نزدیک ترین همسایه (K Nearest Neighbors) و طبقه بند (Radius Nearest Neighbors)

» آشنایی با پارامتر ها و توابع مختلف الگوریتم K Nearest Neighbors مانند تقسیم بندی فضا (Space Partitioning) جهت بهینه سازی این الگوریتم

» آشنایی با مسئله تشخیص دست نوشته از روی تصاویر

» ساخت طبقه بند مخصوص مسئله تشخیص دست نوشته

» آشنایی با پارامترهای الگوریتم Radius Nearest Neighbors جهت بهینه سازی این الگوریتم

این آموزش شامل یک فایل PDF آموزشی همراه با ۸فایل نمونه کد آماده جهت اجرای کدهای آموزش داده شده در فایل آموزشی است. و سعی شده که کدها خط به خط همراه با توضیحات آموزش داده شوند.

همچنین آموزش نصب پایتون Anaconda همراه با Eclipse نیز به صورت رایگان قرار داده شده است که میتوانید این آموزش را از اینجا نیز دانلود کنید.

190,000 ریال – خرید آموزش

<< اگر مشکلی در خرید دارید میتوانید از طریق صفحه تماس با ما پیام خود را ارسال کنید >>

8 دیدگاه دربارهٔ «آموزش مقدماتی داده‌کاوی (طبقه‌بندی) با پایتون و Scikit Learn»

  1. سلام
    وقتتون بخیر
    من آموزش های انگلیسی در رابطه با یادگیری ماشینرو دقیق نگاه کردم و یک پژوهش هم انجام دادم
    اما برای درک الگوریتم جنگل تصادفی مشکل دارم
    شما مطلبی که بتونم این الگوریتم رو درک کنم دارید؟
    من میخواستم بدونم اگر بخواییم الگوریتم جنگل تصادفی رو پیاده کنیم حتما باید از ابزار های مثل R یا پایتون استفاده کنیم مثلا نمیشه با PHP این کارو انجام داد ؟
    متشکرم

    1. با سلام، در دروس رایگان دوره طبقه بندی سعی در ایجاد مفهوم کلی از این الگوریتم داریم. در ضمن محدودیتی برای پیاده سازی آن با هر زبان برنامه نویسی وجود ندارد و میتوان با تمام زبان ها آن را طراحی کرد

  2. با سلام
    آیا این جزوه آموزشی برای یادگیری متن کاوی نیز کاربرد دارد؟
    یا فقط از ابزار nltk برای متن کاوی استفاده می شود؟
    با تشکر

  3. سلام علیکم.بنده این آموزش رو تهیه کردم ولی پس از اجرا شاهد خطاهای زیر هستم:
    WARNING: Logging before flag parsing goes to stderr.
    W0701 19:40:44.340371 1128 deprecation_wrapper.py:119] From C:\Users\pc\PycharmProjects\untitled\venv\lib\site-packages\keras\backend\tensorflow_backend.py:74: The name tf.get_default_graph is deprecated. Please use tf.compat.v1.get_default_graph instead.

    W0701 19:40:44.353384 1128 deprecation_wrapper.py:119] From C:\Users\pc\PycharmProjects\untitled\venv\lib\site-packages\keras\backend\tensorflow_backend.py:517: The name tf.placeholder is deprecated. Please use tf.compat.v1.placeholder instead.

    W0701 19:40:44.354385 1128 deprecation_wrapper.py:119] From C:\Users\pc\PycharmProjects\untitled\venv\lib\site-packages\keras\backend\tensorflow_backend.py:4138: The name tf.random_uniform is deprecated. Please use tf.random.uniform instead.

    W0701 19:40:44.381415 1128 deprecation_wrapper.py:119] From C:\Users\pc\PycharmProjects\untitled\venv\lib\site-packages\keras\optimizers.py:790: The name tf.train.Optimizer is deprecated. Please use tf.compat.v1.train.Optimizer instead.

    W0701 19:40:44.439466 1128 deprecation_wrapper.py:119] From C:\Users\pc\PycharmProjects\untitled\venv\lib\site-packages\keras\backend\tensorflow_backend.py:3295: The name tf.log is deprecated. Please use tf.math.log instead.

    Traceback (most recent call last):
    File “D:/learn2/Work/scikit_python_knn/resources/iris.py”, line 29, in
    model.fit(x_train,y_train,epochs=900)
    File “C:\Users\pc\PycharmProjects\untitled\venv\lib\site-packages\keras\engine\training.py”, line 952, in fit
    batch_size=batch_size)
    File “C:\Users\pc\PycharmProjects\untitled\venv\lib\site-packages\keras\engine\training.py”, line 789, in _standardize_user_data
    exception_prefix=’target’)
    File “C:\Users\pc\PycharmProjects\untitled\venv\lib\site-packages\keras\engine\training_utils.py”, line 138, in standardize_input_data
    str(data_shape))
    ValueError: Error when checking target: expected dense_3 to have shape (2,) but got array with shape (3,)

  4. با عرض سلام و وقت بخیر
    آیا کتابخانه Scikit Learn و کتابخانه های مشابه دیگر مانند sklearn.multiclass برای داده های فارسی نیز کاربرد دارند؟
    نمونه فایل آموزشی برای استفاده از این کتابخانه ها، موجود می باشد؟
    خیلی ممنون می شوم بنده را راهنمائی نمائید.
    با تشکر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *