توزیع پواسون (Poisson Distribution)

یکی از توزیع‌هایی که در صنعت کاربرد فراوانی دارد، توزیع پواسون یا همان poisson distribution است. این توزیع بیان‌گرِ رویدادهایی است که در طول زمان اتفاق می‌افتند و فقط میانگین فاصله‌ی بین این رویدادها را از داده‌های گذشته می‌دانیم. یعنی نمی‌دانیم که هر کدام از رویدادها چه زمانی اتفاق می‌افتند، ولی بر اساس داده‌های گذشته، می‌دانیم که هر کدام از رویدادها به صورت میانگین در یک فاصله‌ی زمانیِ مشخص اتفاق افتاده‌اند. برای مثال، فرض کنید شما صاحبِ یک وب‌سایت هستید و وب‌سایت شما هر چند روز یکبار خراب (down) می‌شود. از داده‌های گذشته فهمیده‌اید که به طور میانگین این رویداد (یعنی خراب شدنِ سایت) هر ۶۰ روز یکبار اتفاق می‌افتد. یعنی ممکن است یکبار ۳۰ روز سایت سالم باشد و در روزِ سی و یکم سایت خراب شود و یا ممکن است در یک دوره‌ی دیگر، وب‌سایت ۹۱ روز سالم باشد و در روزِ نود و دوم خراب شود و میانگین این خرابی‌ها ۶۰ روز یکبار است.

ادامه خواندن “توزیع پواسون (Poisson Distribution)”

توزیع برنولی (Bernoulli Distribution) و توزیع دو جمله‌ای (Binomial Distribution)

یک سکه را به هوا پرتاب می‌کنیم. یا شیر می‌آید یا خط. اگر شیر بیاید پیروز می‌شویم (success) و اگر خط بیاید، می‌بازیم (fail). احتمالِ هر کدام هم ۵۰ درصد است. این ساده‌ترین مثال از توزیع برنولی بود. در این توزیع که دو حالت دارد، با احتمال‌های مشخصی یا برنده می‌شویم یا می‌بازیم و مجموع احتمالاتِ برد و باخت هم برابر یک می‌شود.

ادامه خواندن “توزیع برنولی (Bernoulli Distribution) و توزیع دو جمله‌ای (Binomial Distribution)”

توزیع یکنواخت (Uniform Distribution) و کاربردهای آن

یکی از توزیع‌های ساده و در عین حال کاربردی در آمار و احتمالات، توزیع یکنواخت یا همان uniform distribution است. در این توزیع، احتمالِ وقوع هر کدام از رویدادها، شبیه به هم و برابر یک مقدارِ عددیِ خاص در بازه‌ای مشخص است.

ادامه خواندن “توزیع یکنواخت (Uniform Distribution) و کاربردهای آن”

چگونه بفهمیم داده‌های ما از توزیع نرمال پیروی می‌کند یا خیر؟

در درس گذشته، با داده‌هایی که از توزیع نرمال استفاده می‌کردند آشنا شدیم و یاد گرفتیم که چگونه می‌توان از این توزیع، برای پیش‌بینی و پاسخ به سوالات مختلف در یک کسب‌و‌کار استفاده کرد. همچنین برخی از الگوریتم‌های داده‌کاوی، فرضشان این است که داده‌ها از یک توزیع نرمال پیروی می‌کنند. سوال این‌جاست که چگونه بفهمیم داده‌های ما از توزیع نرمال پیروی می‌کنند یا خیر؟ پاسخ به این سوال را در این درس با هم خواهیم دید.

ادامه خواندن “چگونه بفهمیم داده‌های ما از توزیع نرمال پیروی می‌کند یا خیر؟”

توزیع نرمال (Normal Distribution) یا توزیع گوسی (Gaussian Distribution)

در درس قبلی با مقدماتی در مورد احتمالات و توابع توزیع شده آشنا شدید. در این درس به یکی از توزیع‌های معروف به اسم توزیع نرمال می‌رسیم و کاربردهای مختلفِ آن را با یکدیگر مرور می‌کنیم. توزیع نرمال یا همان توزیع گوسی، در بسیاری از داده‌ها، مشاهده می‌شود. در واقع بسیاری از فرآیند‌های این جهان، داده‌هایی بر اساس توزیع نرمال دارند.

ادامه خواندن “توزیع نرمال (Normal Distribution) یا توزیع گوسی (Gaussian Distribution)”

متغیر تصادفی (Random Variable)، تابع توزیع احتمال (PDF) و تابع توزیع تجمعی (CDF)

فرض کنید یک سکه را بالا می‌اندازید. به احتمال ۵۰ درصد این سکه رو (head) می‌آید و به احتمال ۵۰ درصد این سکه پشت (tail). اگر این احتمال را با x نشان دهیم به این x یک متغیر تصادفی می‌گویند. متغیر (variable) به خاطر این‌که می‌تواند تغییر کند و تصادفی (random) به خاطر این‌که مبتنی بر شانس و تصادف است. مثال دیگر از متغیر تصادفی، می‌تواند قدِ افراد باشد. برای مثال فرض کنید متغیر x قدِ افرادِ مختلف در یک جامعه است. برای مثال شما یک نفر را از میان جامعه انتخاب می‌کنید و می‌توانید بر اساس احتمالات، مثلاً حدس بزنید که به احتمال ۲۰ درصد، قدِ این شخص بین ۱۷۰ تا ۱۸۰ سانتی‌متر است. این حالتِ دوم کمی پیچیده‌تر از مثالِ سکه شد ولی به هر حال به این متغیر هم، یک متغیر تصادفی می‌گویند.

ادامه خواندن “متغیر تصادفی (Random Variable)، تابع توزیع احتمال (PDF) و تابع توزیع تجمعی (CDF)”

جستجوی محلی تکراری (Iterated Local Search) در بهینه‌سازی

جستجوی محلی یا همان Local Search یکی از ساده‌ترین الگوریتم‌های هوش‌مصنوعی در حوزه‌ی بهینه‌سازی است. در درس فعلی می‌خواهیم یک بهینه‌سازیِ ارائه شده برای این الگوریتم به اسم جستجوی محلیِ تکراری را مورد بررسی قرار دهیم تا بتوانیم یکی از نقاط ضعف الگوریتم جستجوی محلی را حذف کنیم.

ادامه خواندن “جستجوی محلی تکراری (Iterated Local Search) در بهینه‌سازی”

بهینه‌سازی سراسری (Global Optimization) و تفاوت آن با کاهش گرادیان (Gradient Descent)

از آن‌جایی که امکان دارد برخی از دانشجویان کمی در درک مفاهیمِ بهینه‌سازی و کارایی آن‌ها دچار سردرگمی شده باشند، در این درس می‌خواهیم کمی به این مباحث بپردازیم تا مدل ذهنی دانشجویان عزیز کمی بهتر با مفاهیم اصلی و بنیادین این حوزه آشنا شود.

ادامه خواندن “بهینه‌سازی سراسری (Global Optimization) و تفاوت آن با کاهش گرادیان (Gradient Descent)”

الگوریتم‌های چند شروعی (Multi Start) در مسائل بهینه‌سازی

با مطالعه‌ی دورس گذشته از دوره‌ی جاری، مشاهده کردیم که الگوریتم‌های فراابتکاری برای این ساخته شده‌اند که بدون جستجوی همه‌ی حالات، بتوانند به یک حالت بهینه دست پیدا کنند.

ادامه خواندن “الگوریتم‌های چند شروعی (Multi Start) در مسائل بهینه‌سازی”

الگوریتم ممتیک (Memetic) بر اساس الگوهای رفتاری

الگوریتم ممتیک یا همان Memetic Algorithm را نمی‌توان یک الگوریتم ثابث فرض کنید. در واقع الگوریتم‌های ممتیک را می‌توان از دسته‌ی الگوریتم‌ها داسنت که به نوعی بهبود یافته‌ی الگوریتم ژنتیک (Genetic Algorithm) هستند. در این درس ما به یکی از معروف‌ترین این الگوریتم‌ها اشاره می‌کنیم. این الگوریتم در واقع ترکیبی از الگوریتم ژنتیک و الگوریتم جستجوی تپه‌نوردی است که در دروس گذشته‌ی دوره‌ی جاری به این دو الگوریتم پرداختیم.

ادامه خواندن “الگوریتم ممتیک (Memetic) بر اساس الگوهای رفتاری”