یک سکه را به هوا پرتاب میکنیم. یا شیر میآید یا خط. اگر شیر بیاید پیروز میشویم (success) و اگر خط بیاید، میبازیم (fail). احتمالِ هر کدام هم ۵۰ درصد است. این سادهترین مثال از توزیع برنولی بود. در این توزیع که دو حالت دارد، با احتمالهای مشخصی یا برنده میشویم یا میبازیم و مجموع احتمالاتِ برد و باخت هم برابر یک میشود.
فرض کنید شخصی که دارای بیماریِ خاصی هست، سکتهی مغزی میکند و بر اساس دادههای قبلی در بیمارستان، ۲۰ درصد از افرادِ بیماری که سکتهی مغزی کردهاند، فوت میکنند (fail). پس ۸۰ درصد از آنها زنده ماندهاند (success). این هم نوعی توزیع برنولی بود. با این تفاوت که احتمالات در این مثال برابر نبودند. اگر احتمال برنده شدن (در این مثال زنده ماندن) را برابر p در نظر بگیریم، پس p = 0.8 است و اگر احتمال شکست (در این مثال فوت کردن) را برابر q در نظر بگیریم، پس q = 0.2 است. شکل زیر نیز همین توزیع را بر روی نمودار با ۱ به معنای پیروی و ۰ به معنای شکست، مشخص میکند:
این توزیع برنولی یا همان Bernoulli بود. حالا اجازه بدهید ببینیم توزیع دو جملهای یا همان binomial چیست. فرض کنید ۱۰ بیمار سکتهی مغزی میکنند. بر اساس دادههای قبلیِ بیمارستان هم میدانیم که بیماری که سکته میکند به احتمال ۸۰ درصد زنده مانده و به احتمال ۲۰ درصد فوت میکند. حالا اگر بخواهیم بدانیم که با چه احتمالی، دقیقاً ۷ نفر از ۱۰ نفر بیماری که سکته کردهاند، زنده میمانند، بایستی از توزیع دو جملهای استفاده کنیم. این توزیع برای پاسخگویی به همین دست سوالات به وجود آمده است.
فرمولِ به دست آوردن احتمال موفقیت (success) در توزیع دو جملهای به صورت زیر است:
برای پاسخ به مسئلهی بالا، n = 10 است. x = 7 یعنی به دنبال تعدادِ دقیقاً ۷ مشاهده که success شوند، هستم و p = 0.8 است. با جایگذاریِ این اعداد در فرمول بالا، میتوانیم احتمال اینکه دقیقاً ۷ نفر از این ۱۰ بیمار که سکتهی مغزی کردهاند، زنده بمانند را به دست بیاوریم:
که نتیه برابر ۰.۲۰ خواهد شد. یعنی به احتمال ۲۰ درصد، دقیقاً ۷ نفر زنده میمانند. البته اینکه دادههای ما از توزیع دو جملهای پیروی کنند، نیازمند چند شرط است. مثلاً اینکه هر کدام از پیشامدها مستقل از دیگری باشند. در مثال بالا، مثلاً اگر یک بیمار جدید که سکته کرده بود، رسید، زنده ماندن یا فوت کردنِ این بیمار ارتباطی با زنده ماندن یا فوت کردنِ بیمار قبلی نداشته باشد. شرط دیگر هم این است که حتماً هر کدام از پیشامدها در دو حالت قرار بگیرند و حالت سومی وجود نداشته باشد. و شرط آخر هم اینکه احتمال موفقیت یا شکست در هر بار از پیشامدها برابر باشد. در مثال بالا، مثلاً احتمال زنده ماندنِ یک بیمار ۸۰ درصد و احتمال زنده ماندن بیماری دیگر ۹۰ درصد نباشد. همه یک احتمال برای زنده ماندن داشته باشند.
در مثالِ بالا، اگر بخواهیم ببینیم احتمالِ اینکه از بین این ۱۰ بیمار، ۰ یا ۱ بیمار زنده بمانند بایستی احتمال ۰ را حساب کرده، سپس احتمال ۱ را هم حساب کرده و آنها را با هم جمع کنیم.
همانطور که دیدید توزیع برنولی و دو جملهای از توزیعهای گسستهای هستند که کاربردهای فراوانی در بین دادهها و فرآیندهای مختلف و حل مسائل گوناگون دارند.
- ۱ » متغیر تصادفی (Random Variable)، تابع توزیع احتمال (PDF) و تابع توزیع تجمعی (CDF)
- ۲ » توزیع نرمال (Normal Distribution) یا توزیع گوسی (Gaussian Distribution)
- ۳ » چگونه بفهمیم دادههای ما از توزیع نرمال پیروی میکند یا خیر؟
- ۴ » توزیع یکنواخت (Uniform Distribution) و کاربردهای آن
- ۵ » توزیع برنولی (Bernoulli Distribution) و توزیع دو جملهای (Binomial Distribution)
- ۶ » توزیع پواسون (Poisson Distribution)
- ۷ » توزیع نمایی (Exponential Distribution)
- ۸ » آزمون برازش Chi-Square برای توزیعهای احتمال
- ۹ » توزیع گاما (Gamma Distribution)
سلام. ساده ولی جالب بود . ممنون
ساده و کارگشا
سلام. ببخشید احتمال زنده موندن ۸۰ درصد هست بعد چطور احتمال اینکه دقیقا ۷ نفر از ده نفر زنده بمونن اونقدر کم شد؟
یک راه ساده ولی تقریبی بدست آوردن این جواب، این هست که احتمال زنده ماندن هر نفر را ضرب در احتمال زنده ماندن نفر بعدی کنیم و تا تعداد افراد مورد نظر اینکار را تکرار کنیم، به عبارتی،
هشت دهم به توان هفت، که معادل دو دهم یا بیست درصد میشود.
بعد ببخشید نمودار اول چجوری رسم شده ؟ کنار صفر یه بازه داریم که به مرکز مختصات نرسیده. این بازه صفر یا بازه یک از کجا اومدن ؟ منظورم مقدار بازه روی خط افقی هست
یک راه ساده ولی تقریبی بدست آوردن این جواب، این هست که احتمال زنده ماندن هر نفر را ضرب در احتمال زنده ماندن نفر بعدی کنیم و تا تعداد افراد مورد نظر اینکار را تکرار کنیم، به عبارتی،
هشت دهم به توان هفت، که معادل دو دهم یا بیست درصد میشود.