ویژگی (Feature) یا همان بُعد (Dimension) در داده‌کاوی چیست؟

ویژگی (Feature) یا بُعد (Dimension) در واقع پایه‌ی بسیاری از عملیاتِ داده‌کاوی و یادگیری‌ماشین است. در این درس می‌خواهیم این مفاهیمِ ساده را با یکدیگر مرور کنیم تا در ادامه راه، بتوانیم ادبیاتِ مشترکی در حوزه داده‌کاوی و یادگیری‌ماشین داشته باشیم.

ادامه خواندن “ویژگی (Feature) یا همان بُعد (Dimension) در داده‌کاوی چیست؟”

معرفی چند نرم افزار کاربردی برای عملیات داده‌کاوی

با مطالعه‌ی دروس گذشته‌ی دوره‌ی جاری، یاد گرفته‌ایم که داده‌کاوی چیست. در این درس، می‌خواهیم چند نرم‌افزار کاربردی حوزه‌ی داده‌کاوی را مروری داشته باشیم. در میانِ نرم‌افزارهای موجود، تمرکز را بر نرم‌افزارهایی گذاشتیم که نیاز به دانشِ برنامه‌نویسی ندارند. یعنی کسانی که به حوزه‌ی برنامه‌نویسی علاقه ندارند یا فعلاً ترجیح می‌دهند از نرم‌افزارهای آماده (بدون طراحیِ نرم افزار و برنامه نویسی) استفاده کنند، می‌توانند یادگیری این نرم‌افزارها را در دستور کار خود قرار دهند.

ادامه خواندن “معرفی چند نرم افزار کاربردی برای عملیات داده‌کاوی”

کاربرد داده‌کاوی و یادگیری ماشین در پردازش متن (Text Processing)

با خواندن دروسِ قبلیِ دوره‌ی جاری، متوجه شده‌اید که داده‌کاوی و یادگیری ماشین بیشتر در دو دسته نظارت شده (مانند طبقه بندها) و غیر نظارت شده (مانند خوشه بندها) قرار دارند .البته که دسته‌های دیگر مانند یادگیری تقویتی نیز وجود دارد. در این درس میخواهیم برای هر کدام از این دسته‌ها، کاربردهایی در دنیای واقعی ارائه دهیم. یکی از حوزه‌های کاربردی در داده‌کاوی، پروژه‌های مختلفِ متن‌کاوی و پردازشِ زبانِ طبیعی (natural language processing) می‌باشد.

ادامه خواندن “کاربرد داده‌کاوی و یادگیری ماشین در پردازش متن (Text Processing)”

سیستم توصیه گر (Recommendation System) چیست؟

اگر درسِ یادگیری ماشین چیست؟ را خوانده باشید، متوجه شده‌اید که مثالِ آن درس در واقع یک مثال از سیستم‌های توصیه‌گر بود. در آن مثال ما میخواستیم به مشتریِ جدید که در سبدِ خریدِ خود چند محصول داشت، یک محصول جدید را پیشنهاد دهیم. اجازه بدهید یک مثال کاربردی دیگر از سیستم‌های توصیه‌گر را در این درس شرح دهیم.

ادامه خواندن “سیستم توصیه گر (Recommendation System) چیست؟”

منظور از داده‌های آموزشی (Training Sets) در طبقه‌بندی چیست؟

اگر با الگوریتم‌های طبقه‌بندی کار کرده باشید (و یا حداقل جایی خوانده باشید) متوجه می‌شوید که عبارتِ داده‌های آموزشی یا همان training sets در کتاب‌ها و مقالات، بسیار تکرار می‌شود. در این نوشته می‌خواهیم ببینیم منظور از training sets چیست و چگونه می‌توان از آن در طبقه‌بندیِ داده‌ها استفاده کرد.

ادامه خواندن “منظور از داده‌های آموزشی (Training Sets) در طبقه‌بندی چیست؟”

تفاوت طبقه‌بندی (Classification) و خوشه‌بندی (Clustering)

کاربرد اصلیِ الگوریتم‌های یادگیری ماشین این است که اطلاعات موجود در داده‌ها را استخراج کنند یا از داده‌های موجود یاد بگیرند. مانند بچه‌ای که با مشاهده‌ی افراد و توصیه‌های والدین یادگیری را انجام می‌دهد. مثلا می‌تواند بفهمد که بخاری داغ است یا نباید به تنهایی از خیابان رَد شود. در واقع کار الگوریتم‌های یادگیری ماشین یا همان machine learning این است که یک خلاصه (summarize) از داده‌ها را پیدا کنند یا در واقع یک مُدل (model) از داده‌ها با هر روشی ایجاد کنند. همان طور که می‌دانید یک مدل همواره شاملِ خلاصه‌ای از داده‌ها است. برای مثال نقشه جهان یک مدل از جهان است که کشورها و راه‌ها را بدون توجه به جزئیات زیاد (مثلاً اینکه چه مغازه‌ای در چه خیابانی است) نگاشت می‌کند.

ادامه خواندن “تفاوت طبقه‌بندی (Classification) و خوشه‌بندی (Clustering)”

خوشه‌بندی (Clustering) چیست؟

فرض کنید، شما یک فروشگاه بزرگِ موادغذایی دارید و مشتریانِ این فروشگاه که بالغ بر ۱۰۰ هزار نفر هستند ویژگی‌های مختلفی دارند. اجازه دهید، سه ویژگیِ زیر را برای یک مشتریِ خاص از مشتریان این فروشگاهِ بزرگ موادغذایی در نظر بگیریم (بقیه‌ی مشتریان نیز این ویژگی‌ها را دارند):

۱. این مشتری آخرین خریدِ خود را چند روز پیش انجام داده است؟ (که با R نام گذاری می‌کنیم)

۲. این مشتری در یکسالِ گذشته، به طورِ میانگین چند روز یک بار از فروشگاه ما خرید کرده است؟ (که با F نام گذاری میکنیم)

۳. این مشتری در یکسالِ گذشته به طورِ میانگین در هر بار خرید، چه مبلغی از فروشگاه خرید کرده است؟ (که با M نامگذاری میکنیم)

ادامه خواندن “خوشه‌بندی (Clustering) چیست؟”

طبقه‌بندی (Classification) چیست؟

مانند مثال قبل در درس داده‌کاوی چیست؟، فرض کنید مدیریتِ یک بانک را برعهده دارید که ۱۰۰ هزار مشتری دارد و می‌خواهید به یک سری از مشتریانِ خود وام دهید. طبیعتاً به افرادی وام را خواهید داد که شانسِ برگرداندن وام توسط آن‌ها بیشتر باشد. هر کدام از این افراد نیز، دارای خصوصیات مختلفی هستند (ویژگی‌های آن‌ها). برای مثال، آیا این شخص خانه دارد یا نه؟ این شخص دارای اتومبیل شخصی هست یا خیر؟ حقوق دریافتیِ این شخص چقدر است؟ و… .

ادامه خواندن “طبقه‌بندی (Classification) چیست؟”

تفاوت هوش مصنوعی، یادگیری ماشین، داده‌کاوی، یادگیری عمیق و علم داده

بسیاری از افراد (حتی افراد متخصص در حوزه‌ی هوش مصنوعی یا علوم داده) ممکن است تفاوت دقیق واژه‌های مورد استفاده در حوزه‌ی هوش مصنوعی و علوم داده را ندانند. دلیل آن هم شاید این باشد که واقعاً مرز روشنی بین این تعاریف وجود ندارد و در بسیار از مواقع این حوزه‌ها با یکدیگر ترکیب می‌شوند. با این حال در این درس قصد داریم تا حد ممکن تفاوت این عبارات را با یکدیگر بیاموزیم و کاربرد هر یک را ببینیم.

ادامه خواندن “تفاوت هوش مصنوعی، یادگیری ماشین، داده‌کاوی، یادگیری عمیق و علم داده”

یادگیری ماشین (Machine Learning) چیست؟

یادگیری ماشین، زیر مجموعه‌ای از هوش مصنوعی است. با استفاده از تکنیک‌های یادگیری ماشین، کامپیوتر، الگوهای موجود در داده‌ها (اطلاعات پردازش شده) را یادگرفته و می‌تواند از آن استفاده کند. توجه داشته باشید که در این تکنیک‌ها، یادگیریْ در یک سیستمِ کامپیوتری، بدون برنامه‌نویسیِ صریح (explicit programming) صورت می‌پذیرد. پاسخ به این سوالات که برنامه‌نویسیِ صریح چیست و یادگیری ماشین چطور کار می‌کند مواردی هستند که در این درس به آن پاسخ می‌دهیم.

ادامه خواندن “یادگیری ماشین (Machine Learning) چیست؟”