در این کتابچه قصد داریم کسانی که به تازگی به جمع متخصصان علوم داده پیوسته اند را به صورت کاربردی با مباحث دادهکاوی آشنا کنیم. از آن جایی که علم داده و دادهکاوی بسیار گسترده است، در این کتابچه تمرکز خود را بر روی یکی از اصلی ترین زیر شاخه ها دادهکاوی قرار میدهیم.
همان طور که میدانید یکی از زیر شاخه های اصلی و بسیار پرکاربرد دادهکاوی، بحث طبقهبندی است. با استفاده از طبقهبندی میتوان الگوهای مختلف موجود در داده ها را فراگرفت. مثلا میتوانید تصویر یک دست نوشته را به صورت خودکار تشخیص داده و یا به صورت خودکار محتواهای مختلف نظرات کاربران یک وب سایت را به دسته های مثبت و منفی (از روی نوشته) تقسیم بندی کنید (که به آن تحیلی احساس یا Sentiment Analyse میگویند). کاربردهای طبقهبندی در بسیاری از کسب و کارها و استارت آپ های جهان مانند گوگل بر کسی پوشیده نیست.
<< اگر مشکلی در خرید دارید میتوانید از طریق صفحه تماس با ما پیام خود را ارسال کنید >>
توضیحات تکمیلی:
در این کتابچه PDF آموزشی سعی داریم مقدماتی ساده شده از بحث طبقهبندی را با یکدیگر یاد بگیریم. برای این کار، از زبان برنامه نویسی پایتون که یکی از معتبرترین زبان ها در حوزه دادهکاوی و یادگیری ماشین است استفاده میکنیم. همچنین جهت پیاده سازی طبقهبندی از کتابخانه Scikit Learn که یکی از کتابخانه ها مطرح این حوزه است کمک میگیریم.
محتوای کلی آموزشی این درس به صورت زیر است:
» آموزش مقدمات ورود به علوم داده و دادهکاوی
» طبقهبندی چیست و چه تفاوتی با رگرسیون دارد؟
» چگونه با استفاده از کتابخانه Pandas داده ها را از فایل CSV بخوانیم؟
» چگونه با استفاده از Numpy آرایه ها و ماتریس های مخصوص این کتابخانه را بسازیم و آن را آماده عملیات دادهکاوی برای کتابخانه Scikit Learn کنیم؟
» ساخت یک طبقه بند ساده همراه با مثال واقعی گل های IRIS
» نحوه ساخت و بازیابی مدل های یادگرفته شده توسط الگوریتم
» آشنایی با طبقه بند K نزدیک ترین همسایه (K Nearest Neighbors) و طبقه بند (Radius Nearest Neighbors)
» آشنایی با پارامتر ها و توابع مختلف الگوریتم K Nearest Neighbors مانند تقسیم بندی فضا (Space Partitioning) جهت بهینه سازی این الگوریتم
» آشنایی با مسئله تشخیص دست نوشته از روی تصاویر
» ساخت طبقه بند مخصوص مسئله تشخیص دست نوشته
» آشنایی با پارامترهای الگوریتم Radius Nearest Neighbors جهت بهینه سازی این الگوریتم
این آموزش شامل یک فایل PDF آموزشی همراه با ۸فایل نمونه کد آماده جهت اجرای کدهای آموزش داده شده در فایل آموزشی است. و سعی شده که کدها خط به خط همراه با توضیحات آموزش داده شوند.
همچنین آموزش نصب پایتون Anaconda همراه با Eclipse نیز به صورت رایگان قرار داده شده است که میتوانید این آموزش را از اینجا نیز دانلود کنید.
<< اگر مشکلی در خرید دارید میتوانید از طریق صفحه تماس با ما پیام خود را ارسال کنید >>
سلام
وقتتون بخیر
من آموزش های انگلیسی در رابطه با یادگیری ماشینرو دقیق نگاه کردم و یک پژوهش هم انجام دادم
اما برای درک الگوریتم جنگل تصادفی مشکل دارم
شما مطلبی که بتونم این الگوریتم رو درک کنم دارید؟
من میخواستم بدونم اگر بخواییم الگوریتم جنگل تصادفی رو پیاده کنیم حتما باید از ابزار های مثل R یا پایتون استفاده کنیم مثلا نمیشه با PHP این کارو انجام داد ؟
متشکرم
با سلام، در دروس رایگان دوره طبقه بندی سعی در ایجاد مفهوم کلی از این الگوریتم داریم. در ضمن محدودیتی برای پیاده سازی آن با هر زبان برنامه نویسی وجود ندارد و میتوان با تمام زبان ها آن را طراحی کرد
با سلام
آیا این جزوه آموزشی برای یادگیری متن کاوی نیز کاربرد دارد؟
یا فقط از ابزار nltk برای متن کاوی استفاده می شود؟
با تشکر
سلام
در این جزوه آموزش متنکاوی موجود نمیباشد
سعی داریم در کتابچههای دیگر به طور اختصاصی به متنکاوی بپردازیم
سلام علیکم.بنده این آموزش رو تهیه کردم ولی پس از اجرا شاهد خطاهای زیر هستم:
WARNING: Logging before flag parsing goes to stderr.
W0701 19:40:44.340371 1128 deprecation_wrapper.py:119] From C:\Users\pc\PycharmProjects\untitled\venv\lib\site-packages\keras\backend\tensorflow_backend.py:74: The name tf.get_default_graph is deprecated. Please use tf.compat.v1.get_default_graph instead.
W0701 19:40:44.353384 1128 deprecation_wrapper.py:119] From C:\Users\pc\PycharmProjects\untitled\venv\lib\site-packages\keras\backend\tensorflow_backend.py:517: The name tf.placeholder is deprecated. Please use tf.compat.v1.placeholder instead.
W0701 19:40:44.354385 1128 deprecation_wrapper.py:119] From C:\Users\pc\PycharmProjects\untitled\venv\lib\site-packages\keras\backend\tensorflow_backend.py:4138: The name tf.random_uniform is deprecated. Please use tf.random.uniform instead.
W0701 19:40:44.381415 1128 deprecation_wrapper.py:119] From C:\Users\pc\PycharmProjects\untitled\venv\lib\site-packages\keras\optimizers.py:790: The name tf.train.Optimizer is deprecated. Please use tf.compat.v1.train.Optimizer instead.
W0701 19:40:44.439466 1128 deprecation_wrapper.py:119] From C:\Users\pc\PycharmProjects\untitled\venv\lib\site-packages\keras\backend\tensorflow_backend.py:3295: The name tf.log is deprecated. Please use tf.math.log instead.
Traceback (most recent call last):
File “D:/learn2/Work/scikit_python_knn/resources/iris.py”, line 29, in
model.fit(x_train,y_train,epochs=900)
File “C:\Users\pc\PycharmProjects\untitled\venv\lib\site-packages\keras\engine\training.py”, line 952, in fit
batch_size=batch_size)
File “C:\Users\pc\PycharmProjects\untitled\venv\lib\site-packages\keras\engine\training.py”, line 789, in _standardize_user_data
exception_prefix=’target’)
File “C:\Users\pc\PycharmProjects\untitled\venv\lib\site-packages\keras\engine\training_utils.py”, line 138, in standardize_input_data
str(data_shape))
ValueError: Error when checking target: expected dense_3 to have shape (2,) but got array with shape (3,)
سلام
مربوط به کدوم فایل میشد
چون ما آموزش keras نداشتیم اصلا!
با عرض سلام و وقت بخیر
آیا کتابخانه Scikit Learn و کتابخانه های مشابه دیگر مانند sklearn.multiclass برای داده های فارسی نیز کاربرد دارند؟
نمونه فایل آموزشی برای استفاده از این کتابخانه ها، موجود می باشد؟
خیلی ممنون می شوم بنده را راهنمائی نمائید.
با تشکر
سلام خدمت شما
بله شدنی هست
من تو اینترنت نمونه فارسی پیدا نکردم، ولی پیاده سازیش بسیار ساده هست