توزیع گاما (Gamma Distribution)

تا به این‌جا در دوره‌ی جاری، با انواع مختلفی از توابع توزیع احتمالی آشنا شدیم. تابع توزیع برنولی، دوجمله‌ای، پواسون، نمایی و توزیع نرمال از جمله این دست از توزیع‌ها بودند. در درس جاری به توزیع پیچیده‌تری با اسم توزیع گاما یا همان gamma distribution خواهیم پرداخت و کاربرد این توزیع را با هم مرور خواهیم کرد. توجه داشته باشید که توزیع گاما از کاربردی‌ترین توزیع‌های احتمالی در صنعت است.

ادامه خواندن “توزیع گاما (Gamma Distribution)”

آزمون برازش Chi-Square برای توزیع‌های احتمال

در دوره‌ی جاری، به بررسیِ انواع تابع توزیع احتمال و کاربردهای آن پرداختیم. اما سوال این‌جاست که چگونه بفهمیم فرآیندهایمان از یک توزیع خاص (مثلاً توزیع پواسون یا توزیع نرمال) پیروی می‌کنند یا خیر؟ در درس «چگونگیِ ارزیابی داده‌ها با توجه به توزیع نرمال»، فهمیدیم که چگونه می‌توانیم ببینیم که آیا داده‌های ما از توزیع نرمال پیروی می‌کنند یا خیر. در درس جاری می‌خواهیم به روش chi-square که یکی از روش‌های معروف و شناخته شده برای ارزیابی توزیعِ فرآیند‌ها هست، اشاره‌ی کوچکی کنیم. توسط این روش می‌توانیم توزیع‌های احتمالیِ دیگری را نیز بر روی داده‌هایمان ارزیابی کنیم. مثلاً ببینیم که آیا مجموعه‌ی داده‌ی ما از توزیع پواسون پیروی می‌کند یا خیر؟

ادامه خواندن “آزمون برازش Chi-Square برای توزیع‌های احتمال”

توزیع نمایی (Exponential Distribution)

در دروس قبلی، به توزیع‌های مختلف مانند توزیع نرمال، توزیع دو جمله‌ای یا توزیع پواسون اشاره کردیم. این درس را با معرفی توزیع نمایی یا همان exponential distribution ادامه می‌دهیم. یکی از کاربردهای توزیع نمایی، پاسخ به این سوال است که تا موقع رخ دادنِ یک رویداد، چقدر زمان باقی مانده است؟ برای مثال شما به دفتر کار خود می‌رسید و می‌بینید که مدیرتان با تلفن صحبت می‌کند. با خود این سوال را می‌پرسید که تلفنِ او چند دقیقه‌ی دیگر تمام می‌شود؟ یا پلیسی که وسط یک نزاع خیابانی سر می‌رسد و با خود می‌گوید چند ثانیه دیگر این درگیری تمام می‌شود؟ یا حتی پاسخ به این سوال که چند وقت دیگر در فلان منطقه زلزله می‌شود؟ چون این فرآیندها و بسیاری از فرآیند‌های دیگر، توسط تابع نمایی مدل‌سازی می‌شوند، پاسخ به این سوالات نیز توسط توزیع نمایی انجام می‌شود.

ادامه خواندن “توزیع نمایی (Exponential Distribution)”

توزیع پواسون (Poisson Distribution)

یکی از توزیع‌هایی که در صنعت کاربرد فراوانی دارد، توزیع پواسون یا همان poisson distribution است. این توزیع بیان‌گرِ رویدادهایی است که در طول زمان اتفاق می‌افتند و فقط میانگین فاصله‌ی بین این رویدادها را از داده‌های گذشته می‌دانیم. یعنی نمی‌دانیم که هر کدام از رویدادها چه زمانی اتفاق می‌افتند، ولی بر اساس داده‌های گذشته، می‌دانیم که هر کدام از رویدادها به صورت میانگین در یک فاصله‌ی زمانیِ مشخص اتفاق افتاده‌اند. برای مثال، فرض کنید شما صاحبِ یک وب‌سایت هستید و وب‌سایت شما هر چند روز یکبار خراب (down) می‌شود. از داده‌های گذشته فهمیده‌اید که به طور میانگین این رویداد (یعنی خراب شدنِ سایت) هر ۶۰ روز یکبار اتفاق می‌افتد. یعنی ممکن است یکبار ۳۰ روز سایت سالم باشد و در روزِ سی و یکم سایت خراب شود و یا ممکن است در یک دوره‌ی دیگر، وب‌سایت ۹۱ روز سالم باشد و در روزِ نود و دوم خراب شود و میانگین این خرابی‌ها ۶۰ روز یکبار است.

ادامه خواندن “توزیع پواسون (Poisson Distribution)”

توزیع برنولی (Bernoulli Distribution) و توزیع دو جمله‌ای (Binomial Distribution)

یک سکه را به هوا پرتاب می‌کنیم. یا شیر می‌آید یا خط. اگر شیر بیاید پیروز می‌شویم (success) و اگر خط بیاید، می‌بازیم (fail). احتمالِ هر کدام هم ۵۰ درصد است. این ساده‌ترین مثال از توزیع برنولی بود. در این توزیع که دو حالت دارد، با احتمال‌های مشخصی یا برنده می‌شویم یا می‌بازیم و مجموع احتمالاتِ برد و باخت هم برابر یک می‌شود.

ادامه خواندن “توزیع برنولی (Bernoulli Distribution) و توزیع دو جمله‌ای (Binomial Distribution)”

توزیع یکنواخت (Uniform Distribution) و کاربردهای آن

یکی از توزیع‌های ساده و در عین حال کاربردی در آمار و احتمالات، توزیع یکنواخت یا همان uniform distribution است. در این توزیع، احتمالِ وقوع هر کدام از رویدادها، شبیه به هم و برابر یک مقدارِ عددیِ خاص در بازه‌ای مشخص است.

ادامه خواندن “توزیع یکنواخت (Uniform Distribution) و کاربردهای آن”

چگونه بفهمیم داده‌های ما از توزیع نرمال پیروی می‌کند یا خیر؟

در درس گذشته، با داده‌هایی که از توزیع نرمال استفاده می‌کردند آشنا شدیم و یاد گرفتیم که چگونه می‌توان از این توزیع، برای پیش‌بینی و پاسخ به سوالات مختلف در یک کسب‌و‌کار استفاده کرد. همچنین برخی از الگوریتم‌های داده‌کاوی، فرضشان این است که داده‌ها از یک توزیع نرمال پیروی می‌کنند. سوال این‌جاست که چگونه بفهمیم داده‌های ما از توزیع نرمال پیروی می‌کنند یا خیر؟ پاسخ به این سوال را در این درس با هم خواهیم دید.

ادامه خواندن “چگونه بفهمیم داده‌های ما از توزیع نرمال پیروی می‌کند یا خیر؟”

توزیع نرمال (Normal Distribution) یا توزیع گوسی (Gaussian Distribution)

در درس قبلی با مقدماتی در مورد احتمالات و توابع توزیع شده آشنا شدید. در این درس به یکی از توزیع‌های معروف به اسم توزیع نرمال می‌رسیم و کاربردهای مختلفِ آن را با یکدیگر مرور می‌کنیم. توزیع نرمال یا همان توزیع گوسی، در بسیاری از داده‌ها، مشاهده می‌شود. در واقع بسیاری از فرآیند‌های این جهان، داده‌هایی بر اساس توزیع نرمال دارند.

ادامه خواندن “توزیع نرمال (Normal Distribution) یا توزیع گوسی (Gaussian Distribution)”

متغیر تصادفی (Random Variable)، تابع توزیع احتمال (PDF) و تابع توزیع تجمعی (CDF)

فرض کنید یک سکه را بالا می‌اندازید. به احتمال ۵۰ درصد این سکه رو (head) می‌آید و به احتمال ۵۰ درصد این سکه پشت (tail). اگر این احتمال را با x نشان دهیم به این x یک متغیر تصادفی می‌گویند. متغیر (variable) به خاطر این‌که می‌تواند تغییر کند و تصادفی (random) به خاطر این‌که مبتنی بر شانس و تصادف است. مثال دیگر از متغیر تصادفی، می‌تواند قدِ افراد باشد. برای مثال فرض کنید متغیر x قدِ افرادِ مختلف در یک جامعه است. برای مثال شما یک نفر را از میان جامعه انتخاب می‌کنید و می‌توانید بر اساس احتمالات، مثلاً حدس بزنید که به احتمال ۲۰ درصد، قدِ این شخص بین ۱۷۰ تا ۱۸۰ سانتی‌متر است. این حالتِ دوم کمی پیچیده‌تر از مثالِ سکه شد ولی به هر حال به این متغیر هم، یک متغیر تصادفی می‌گویند.

ادامه خواندن “متغیر تصادفی (Random Variable)، تابع توزیع احتمال (PDF) و تابع توزیع تجمعی (CDF)”