چیستیو | علوم داده و نرم افزار | صفحه 6 از 24 | محلی برای یادگیریِ علوم‌داده و مهندسیِ نرم‌افزار

سپتامبر 25, 2019سپتامبر 25, 2019

توزیع پواسون (Poisson Distribution)

یکی از توزیع‌هایی که در صنعت کاربرد فراوانی دارد، توزیع پواسون یا همان poisson distribution است. این توزیع بیان‌گرِ رویدادهایی است که در طول زمان اتفاق می‌افتند و فقط میانگین فاصله‌ی بین این رویدادها را از داده‌های گذشته می‌دانیم. یعنی نمی‌دانیم که هر کدام از رویدادها چه زمانی اتفاق می‌افتند، ولی بر اساس داده‌های گذشته، می‌دانیم که هر کدام از رویدادها به صورت میانگین در یک فاصله‌ی زمانیِ مشخص اتفاق افتاده‌اند. برای مثال، فرض کنید شما صاحبِ یک وب‌سایت هستید و وب‌سایت شما هر چند روز یکبار خراب (down) می‌شود. از داده‌های گذشته فهمیده‌اید که به طور میانگین این رویداد (یعنی خراب شدنِ سایت) هر ۶۰ روز یکبار اتفاق می‌افتد. یعنی ممکن است یکبار ۳۰ روز سایت سالم باشد و در روزِ سی و یکم سایت خراب شود و یا ممکن است در یک دوره‌ی دیگر، وب‌سایت ۹۱ روز سالم باشد و در روزِ نود و دوم خراب شود و میانگین این خرابی‌ها ۶۰ روز یکبار است.

ادامه خواندن

سپتامبر 24, 2019سپتامبر 24, 2019

توزیع برنولی (Bernoulli Distribution) و توزیع دو جمله‌ای (Binomial Distribution)

یک سکه را به هوا پرتاب می‌کنیم. یا شیر می‌آید یا خط. اگر شیر بیاید پیروز می‌شویم (success) و اگر خط بیاید، می‌بازیم (fail). احتمالِ هر کدام هم ۵۰ درصد است. این ساده‌ترین مثال از توزیع برنولی بود. در این توزیع که دو حالت دارد، با احتمال‌های مشخصی یا برنده می‌شویم یا می‌بازیم و مجموع احتمالاتِ برد و باخت هم برابر یک می‌شود.

ادامه خواندن

سپتامبر 23, 2019سپتامبر 28, 2019

توزیع یکنواخت (Uniform Distribution) و کاربردهای آن

یکی از توزیع‌های ساده و در عین حال کاربردی در آمار و احتمالات، توزیع یکنواخت یا همان uniform distribution است. در این توزیع، احتمالِ وقوع هر کدام از رویدادها، شبیه به هم و برابر یک مقدارِ عددیِ خاص در بازه‌ای مشخص است.

ادامه خواندن

سپتامبر 23, 2019سپتامبر 23, 2019

چگونه بفهمیم داده‌های ما از توزیع نرمال پیروی می‌کند یا خیر؟

در درس گذشته، با داده‌هایی که از توزیع نرمال استفاده می‌کردند آشنا شدیم و یاد گرفتیم که چگونه می‌توان از این توزیع، برای پیش‌بینی و پاسخ به سوالات مختلف در یک کسب‌و‌کار استفاده کرد. همچنین برخی از الگوریتم‌های داده‌کاوی، فرضشان این است که داده‌ها از یک توزیع نرمال پیروی می‌کنند. سوال این‌جاست که چگونه بفهمیم داده‌های ما از توزیع نرمال پیروی می‌کنند یا خیر؟ پاسخ به این سوال را در این درس با هم خواهیم دید.

ادامه خواندن

سپتامبر 22, 2019دسامبر 14, 2020

توزیع نرمال (Normal Distribution) یا توزیع گوسی (Gaussian Distribution)

در درس قبلی با مقدماتی در مورد احتمالات و توابع توزیع شده آشنا شدید. در این درس به یکی از توزیع‌های معروف به اسم توزیع نرمال می‌رسیم و کاربردهای مختلفِ آن را با یکدیگر مرور می‌کنیم. توزیع نرمال یا همان توزیع گوسی، در بسیاری از داده‌ها، مشاهده می‌شود. در واقع بسیاری از فرآیند‌های این جهان، داده‌هایی بر اساس توزیع نرمال دارند.

ادامه خواندن

سپتامبر 21, 2019آگوست 6, 2021

متغیر تصادفی (Random Variable)، تابع توزیع احتمال (PDF) و تابع توزیع تجمعی (CDF)

فرض کنید یک سکه را بالا می‌اندازید. به احتمال ۵۰ درصد این سکه رو (head) می‌آید و به احتمال ۵۰ درصد این سکه پشت (tail). اگر این احتمال را با x نشان دهیم به این x یک متغیر تصادفی می‌گویند. متغیر (variable) به خاطر این‌که می‌تواند تغییر کند و تصادفی (random) به خاطر این‌که مبتنی بر شانس و تصادف است. مثال دیگر از متغیر تصادفی، می‌تواند قدِ افراد باشد. برای مثال فرض کنید متغیر x قدِ افرادِ مختلف در یک جامعه است. برای مثال شما یک نفر را از میان جامعه انتخاب می‌کنید و می‌توانید بر اساس احتمالات، مثلاً حدس بزنید که به احتمال ۲۰ درصد، قدِ این شخص بین ۱۷۰ تا ۱۸۰ سانتی‌متر است. این حالتِ دوم کمی پیچیده‌تر از مثالِ سکه شد ولی به هر حال به این متغیر هم، یک متغیر تصادفی می‌گویند.

ادامه خواندن

آوریل 7, 2019آوریل 7, 2019

جستجوی محلی تکراری (Iterated Local Search) در بهینه‌سازی

جستجوی محلی یا همان Local Search یکی از ساده‌ترین الگوریتم‌های هوش‌مصنوعی در حوزه‌ی بهینه‌سازی است. در درس فعلی می‌خواهیم یک بهینه‌سازیِ ارائه شده برای این الگوریتم به اسم جستجوی محلیِ تکراری را مورد بررسی قرار دهیم تا بتوانیم یکی از نقاط ضعف الگوریتم جستجوی محلی را حذف کنیم.

ادامه خواندن

آوریل 2, 2019آوریل 2, 2019

بهینه‌سازی سراسری (Global Optimization) و تفاوت آن با کاهش گرادیان (Gradient Descent)

از آن‌جایی که امکان دارد برخی از دانشجویان کمی در درک مفاهیمِ بهینه‌سازی و کارایی آن‌ها دچار سردرگمی شده باشند، در این درس می‌خواهیم کمی به این مباحث بپردازیم تا مدل ذهنی دانشجویان عزیز کمی بهتر با مفاهیم اصلی و بنیادین این حوزه آشنا شود.

ادامه خواندن

آوریل 1, 2019آوریل 1, 2019

الگوریتم‌های چند شروعی (Multi Start) در مسائل بهینه‌سازی

با مطالعه‌ی دورس گذشته از دوره‌ی جاری، مشاهده کردیم که الگوریتم‌های فراابتکاری برای این ساخته شده‌اند که بدون جستجوی همه‌ی حالات، بتوانند به یک حالت بهینه دست پیدا کنند.

ادامه خواندن

مارس 27, 2019سپتامبر 17, 2019

الگوریتم ممتیک (Memetic) بر اساس الگوهای رفتاری

الگوریتم ممتیک یا همان Memetic Algorithm را نمی‌توان یک الگوریتم ثابث فرض کنید. در واقع الگوریتم‌های ممتیک را می‌توان از دسته‌ی الگوریتم‌ها داسنت که به نوعی بهبود یافته‌ی الگوریتم ژنتیک (Genetic Algorithm) هستند. در این درس ما به یکی از معروف‌ترین این الگوریتم‌ها اشاره می‌کنیم. این الگوریتم در واقع ترکیبی از الگوریتم ژنتیک و الگوریتم جستجوی تپه‌نوردی است که در دروس گذشته‌ی دوره‌ی جاری به این دو الگوریتم پرداختیم.

ادامه خواندن

ترم اول » دوره ریاضیات پایه و جبر خطی برای یادگیری‌ماشین

ترم دوم » دوره آمار مقدماتی و تحلیل اکتشافی داده

ترم سوم » دوره مقدمات داده کاوی و یادگیری ماشین

ترم چهارم » دوره آشنایی با روش‌های پیش‌پردازش داده‌ها

ترم پنجم » دوره الگوریتم‌های طبقه بندی (Classification)

ترم ششم » دوره الگوریتم‌های خوشه بندی (Clustering)

ترم هفتم » دوره مقدمات شبکه‌های عصبی (Neural Networks)

ترم هشتم » دوره‌ی یادگیری عمیق (Deep Learning)

ترم نهم » دوره‌ متن‌کاوی (TEXT MINING) و پردازش زبان طبیعی (NLP)

ترم دهم » آشنایی با الگوریتم‌های فراابتکاری (META HEURISTIC)

ترم یازدهم » دوره توزیع احتمال (Probability Distributions) و کاربردها

ترم اول » تکنیک‌ها و ابزارهای کلان داده (Big Data)

ترم دوم » آشنایی با سبک برنامه نویسی Map Reduce و مدل محاسبات توزیع شده

ترم سوم » دوره آشنایی با انبار داده (Data Warehouse) و کاربردهای آن

ترم چهارم » آشنایی با پایگاه داده های NoSQL

ترم پنجم » دوره همروندی (Concurrency) و مدیریت ترمیم در پایگاه داده ها

ترم ششم » دوره آموزش برنامه نویسی و مهندسی نرم افزار مبتنی بر اصل SOLID

ترم هفتم » دوره آشنایی با ضد الگوها (Anti Patterns) در برنامه نویسی

ترم هشتم » دوره سیستم های توزیع شده (Distributed Systems)

ترم نهم » دوره توابع درهم ساز (Hash Functions)

توزیع پواسون (Poisson Distribution)

توزیع برنولی (Bernoulli Distribution) و توزیع دو جمله‌ای (Binomial Distribution)

توزیع یکنواخت (Uniform Distribution) و کاربردهای آن

چگونه بفهمیم داده‌های ما از توزیع نرمال پیروی می‌کند یا خیر؟

توزیع نرمال (Normal Distribution) یا توزیع گوسی (Gaussian Distribution)

متغیر تصادفی (Random Variable)، تابع توزیع احتمال (PDF) و تابع توزیع تجمعی (CDF)

جستجوی محلی تکراری (Iterated Local Search) در بهینه‌سازی

بهینه‌سازی سراسری (Global Optimization) و تفاوت آن با کاهش گرادیان (Gradient Descent)

الگوریتم‌های چند شروعی (Multi Start) در مسائل بهینه‌سازی

الگوریتم ممتیک (Memetic) بر اساس الگوهای رفتاری