تا به اینجا در دورهی جاری، با انواع مختلفی از توابع توزیع احتمالی آشنا شدیم. تابع توزیع برنولی، دوجملهای، پواسون، نمایی و توزیع نرمال از جمله این دست از توزیعها بودند. در درس جاری به توزیع پیچیدهتری با اسم توزیع گاما یا همان gamma distribution خواهیم پرداخت و کاربرد این توزیع را با هم مرور خواهیم کرد. توجه داشته باشید که توزیع گاما از کاربردیترین توزیعهای احتمالی در صنعت است.
ادامه خواندن “توزیع گاما (Gamma Distribution)”آزمون برازش Chi-Square برای توزیعهای احتمال
در دورهی جاری، به بررسیِ انواع تابع توزیع احتمال و کاربردهای آن پرداختیم. اما سوال اینجاست که چگونه بفهمیم فرآیندهایمان از یک توزیع خاص (مثلاً توزیع پواسون یا توزیع نرمال) پیروی میکنند یا خیر؟ در درس «چگونگیِ ارزیابی دادهها با توجه به توزیع نرمال»، فهمیدیم که چگونه میتوانیم ببینیم که آیا دادههای ما از توزیع نرمال پیروی میکنند یا خیر. در درس جاری میخواهیم به روش chi-square که یکی از روشهای معروف و شناخته شده برای ارزیابی توزیعِ فرآیندها هست، اشارهی کوچکی کنیم. توسط این روش میتوانیم توزیعهای احتمالیِ دیگری را نیز بر روی دادههایمان ارزیابی کنیم. مثلاً ببینیم که آیا مجموعهی دادهی ما از توزیع پواسون پیروی میکند یا خیر؟
ادامه خواندن “آزمون برازش Chi-Square برای توزیعهای احتمال”توزیع نمایی (Exponential Distribution)
در دروس قبلی، به توزیعهای مختلف مانند توزیع نرمال، توزیع دو جملهای یا توزیع پواسون اشاره کردیم. این درس را با معرفی توزیع نمایی یا همان exponential distribution ادامه میدهیم. یکی از کاربردهای توزیع نمایی، پاسخ به این سوال است که تا موقع رخ دادنِ یک رویداد، چقدر زمان باقی مانده است؟ برای مثال شما به دفتر کار خود میرسید و میبینید که مدیرتان با تلفن صحبت میکند. با خود این سوال را میپرسید که تلفنِ او چند دقیقهی دیگر تمام میشود؟ یا پلیسی که وسط یک نزاع خیابانی سر میرسد و با خود میگوید چند ثانیه دیگر این درگیری تمام میشود؟ یا حتی پاسخ به این سوال که چند وقت دیگر در فلان منطقه زلزله میشود؟ چون این فرآیندها و بسیاری از فرآیندهای دیگر، توسط تابع نمایی مدلسازی میشوند، پاسخ به این سوالات نیز توسط توزیع نمایی انجام میشود.
ادامه خواندن “توزیع نمایی (Exponential Distribution)”توزیع پواسون (Poisson Distribution)
یکی از توزیعهایی که در صنعت کاربرد فراوانی دارد، توزیع پواسون یا همان poisson distribution است. این توزیع بیانگرِ رویدادهایی است که در طول زمان اتفاق میافتند و فقط میانگین فاصلهی بین این رویدادها را از دادههای گذشته میدانیم. یعنی نمیدانیم که هر کدام از رویدادها چه زمانی اتفاق میافتند، ولی بر اساس دادههای گذشته، میدانیم که هر کدام از رویدادها به صورت میانگین در یک فاصلهی زمانیِ مشخص اتفاق افتادهاند. برای مثال، فرض کنید شما صاحبِ یک وبسایت هستید و وبسایت شما هر چند روز یکبار خراب (down) میشود. از دادههای گذشته فهمیدهاید که به طور میانگین این رویداد (یعنی خراب شدنِ سایت) هر ۶۰ روز یکبار اتفاق میافتد. یعنی ممکن است یکبار ۳۰ روز سایت سالم باشد و در روزِ سی و یکم سایت خراب شود و یا ممکن است در یک دورهی دیگر، وبسایت ۹۱ روز سالم باشد و در روزِ نود و دوم خراب شود و میانگین این خرابیها ۶۰ روز یکبار است.
ادامه خواندن “توزیع پواسون (Poisson Distribution)”توزیع برنولی (Bernoulli Distribution) و توزیع دو جملهای (Binomial Distribution)
یک سکه را به هوا پرتاب میکنیم. یا شیر میآید یا خط. اگر شیر بیاید پیروز میشویم (success) و اگر خط بیاید، میبازیم (fail). احتمالِ هر کدام هم ۵۰ درصد است. این سادهترین مثال از توزیع برنولی بود. در این توزیع که دو حالت دارد، با احتمالهای مشخصی یا برنده میشویم یا میبازیم و مجموع احتمالاتِ برد و باخت هم برابر یک میشود.
ادامه خواندن “توزیع برنولی (Bernoulli Distribution) و توزیع دو جملهای (Binomial Distribution)”توزیع یکنواخت (Uniform Distribution) و کاربردهای آن
یکی از توزیعهای ساده و در عین حال کاربردی در آمار و احتمالات، توزیع یکنواخت یا همان uniform distribution است. در این توزیع، احتمالِ وقوع هر کدام از رویدادها، شبیه به هم و برابر یک مقدارِ عددیِ خاص در بازهای مشخص است.
ادامه خواندن “توزیع یکنواخت (Uniform Distribution) و کاربردهای آن”چگونه بفهمیم دادههای ما از توزیع نرمال پیروی میکند یا خیر؟
در درس گذشته، با دادههایی که از توزیع نرمال استفاده میکردند آشنا شدیم و یاد گرفتیم که چگونه میتوان از این توزیع، برای پیشبینی و پاسخ به سوالات مختلف در یک کسبوکار استفاده کرد. همچنین برخی از الگوریتمهای دادهکاوی، فرضشان این است که دادهها از یک توزیع نرمال پیروی میکنند. سوال اینجاست که چگونه بفهمیم دادههای ما از توزیع نرمال پیروی میکنند یا خیر؟ پاسخ به این سوال را در این درس با هم خواهیم دید.
ادامه خواندن “چگونه بفهمیم دادههای ما از توزیع نرمال پیروی میکند یا خیر؟”توزیع نرمال (Normal Distribution) یا توزیع گوسی (Gaussian Distribution)
در درس قبلی با مقدماتی در مورد احتمالات و توابع توزیع شده آشنا شدید. در این درس به یکی از توزیعهای معروف به اسم توزیع نرمال میرسیم و کاربردهای مختلفِ آن را با یکدیگر مرور میکنیم. توزیع نرمال یا همان توزیع گوسی، در بسیاری از دادهها، مشاهده میشود. در واقع بسیاری از فرآیندهای این جهان، دادههایی بر اساس توزیع نرمال دارند.
ادامه خواندن “توزیع نرمال (Normal Distribution) یا توزیع گوسی (Gaussian Distribution)”متغیر تصادفی (Random Variable)، تابع توزیع احتمال (PDF) و تابع توزیع تجمعی (CDF)
فرض کنید یک سکه را بالا میاندازید. به احتمال ۵۰ درصد این سکه رو (head) میآید و به احتمال ۵۰ درصد این سکه پشت (tail). اگر این احتمال را با x نشان دهیم به این x یک متغیر تصادفی میگویند. متغیر (variable) به خاطر اینکه میتواند تغییر کند و تصادفی (random) به خاطر اینکه مبتنی بر شانس و تصادف است. مثال دیگر از متغیر تصادفی، میتواند قدِ افراد باشد. برای مثال فرض کنید متغیر x قدِ افرادِ مختلف در یک جامعه است. برای مثال شما یک نفر را از میان جامعه انتخاب میکنید و میتوانید بر اساس احتمالات، مثلاً حدس بزنید که به احتمال ۲۰ درصد، قدِ این شخص بین ۱۷۰ تا ۱۸۰ سانتیمتر است. این حالتِ دوم کمی پیچیدهتر از مثالِ سکه شد ولی به هر حال به این متغیر هم، یک متغیر تصادفی میگویند.
ادامه خواندن “متغیر تصادفی (Random Variable)، تابع توزیع احتمال (PDF) و تابع توزیع تجمعی (CDF)”