توزیع پواسون (Poisson Distribution)

مدرس: مسعود کاویانی

یکی از توزیع‌هایی که در صنعت کاربرد فراوانی دارد، توزیع پواسون یا همان poisson distribution است. این توزیع بیان‌گرِ رویدادهایی است که در طول زمان اتفاق می‌افتند و فقط میانگین فاصله‌ی بین این رویدادها را از داده‌های گذشته می‌دانیم. یعنی نمی‌دانیم که هر کدام از رویدادها چه زمانی اتفاق می‌افتند، ولی بر اساس داده‌های گذشته، می‌دانیم که هر کدام از رویدادها به صورت میانگین در یک فاصله‌ی زمانیِ مشخص اتفاق افتاده‌اند. برای مثال، فرض کنید شما صاحبِ یک وب‌سایت هستید و وب‌سایت شما هر چند روز یکبار خراب (down) می‌شود. از داده‌های گذشته فهمیده‌اید که به طور میانگین این رویداد (یعنی خراب شدنِ سایت) هر ۶۰ روز یکبار اتفاق می‌افتد. یعنی ممکن است یکبار ۳۰ روز سایت سالم باشد و در روزِ سی و یکم سایت خراب شود و یا ممکن است در یک دوره‌ی دیگر، وب‌سایت ۹۱ روز سالم باشد و در روزِ نود و دوم خراب شود و میانگین این خرابی‌ها ۶۰ روز یکبار است.

نمودار زیر را نگاه کنید. این نمودار خراب شدنِ وب‌سایت در روزهای مختلف در طی ۶۰۰ روز را نمایش می‌دهد:

توزیع پواسون

توزیع پواسون نمونه‌های زیادی در اطراف ما دارد. برای مثال، تعداد افرادی که به بخش پشتیبانی تلفن می‌زنند، ویزیتورهای یک وب‌سایت یا حتی بالا و پایین رفتن یک سهام خاص در بورس همگی می‌توانند از توزیع پواسون پیروی کنند. به فرآیند‌هایی مانندِ این مثال‌ها، فرآیند‌های پواسون (poisson process) گفته می‌شود.

اگر فرآیندی از توزیع پواسون پیروی کرد، می‌توان آن را توسطِ فرمول زیر محاسبه نمود:

توزیع پواسون

در فرمولِ بالا حرف lambda، در واقع تعداد رویدادهای مورد انتظارِ ما در یک بازه‌ی زمانی مشخص است.

برای روشن شدنِ فرمولِ بالا فرض کنید شما مسئول نگه‌داری یک وب‌سایتِ فروشگاهی هستید و با توجه داده‌های گذشته از این وب‌سایت، متوجه شده‌اید که مشتریان این سایت، به طور میانگین در ساعت، ۵ خرید انجام می‌دهند. یعنی به صورت میانگین در ۱۲ دقیقه ۱ خرید توسط مشتریان در سایت انجام می‌شود. برای محاسبه‌ی lambda به صورت زیر عمل می‌کنیم:

توزیع پواسون

حالا می‌خواهیم به این سوال پاسخ دهیم که با چه احتمالی، دقیقاً ۳ مشتری در یک ساعت از ما خرید می‌کنند؟ پاسخ به صورت زیر توسط فرمول اصلیِ پواسون محاسبه می‌شود:

توزیع پواسون مثال

پس، به احتمال ۱۴ درصد، دقیقاً ۳ مشتری در یک ساعت از ما خرید خواهند کرد. شکل زیر احتمالات را برای تعداد مختلفی از خرید مشتری‌ها در یک ساعت نمایش می‌دهد:

(منبع تصویر این مقاله از towardsdatascience است)

همان‌طور که می‌بینید بیشترین احتمال در عدد ۵ اتفاق افتاده است (lambda) و هر چقدر این از این عدد فاصله بگیریم، احتمالات کمتر می‌شود.

بیایید نمودار توزیع پواسون را برای lambdaهای مختلف برای خریدهای مشتریان وب‌سایت، مشاهده کنیم:

(منبع تصویر این مقاله از towardsdatascience است)

همان‌طور که می‌بینید با تغییر lambda نقطه‌ی قله در نمودار تغییر کرده است (نقطه‌ی قله در جایی قرار می‌گیرد که lambda آن مقدار را داشته باشد) و به همان نسبت، نقاط دیگر نیز تغییراتی داشته‌اند.

یکی دیگر از کاربردهای توزیع پواسون، پاسخ به این سوال است که برای مشاهده‌ی اولین رویداد، چقدر بایستی صبر کنیم؟ برای مثال الان ساعت ۹:۰۸ دقیقه است و شما به محل کارتان رسیده‌اید. حدوداً چند دقیقه طول می‌کشد تا اولین خرید توسط مشتری از سایت شما انجام شود. برای این کار از فرمول زیر استفاده می‌کنیم. این فرمول به ما می‌گوید که با چه احتمالی، اولین مشتری در زمانی مشخص، خرید می‌کند. برای مثال می‌خواهیم ببینیم که از زمانِ حضور ما در محل کار، با چه احتمالی، اولین خرید بیشتر از ۶ دقیقه طول می‌کشد:

توزیع پواسون

که برابر ۶۰.۶۵ درصد شده است. حالا فرض کنید می‌خواهیم بدانیم که با چه احتمالی، اولین خرید در کمتر از ۶ دقیقه از زمانِ رسیدنِ ما انجام می‌شود. کافیست عددِ بالا را از ۱ کم کنیم تا به عدد ۳۹.۴ درصد برسیم.

همان‌طور که دیدید، توزیع پواسون کاربردهای مختلف در صنایع دارد. هر کجا که تعداد رویدادهای مختلف در زمان‌های متفاوت به صورت تصادفی رخ دهد، می‌توان این احتمال را داد که فرآیند از توزیع پواسون پیروی کند. البته برای این‌که یک فرآیند از توزیع پواسون پیروی کند، بایستی چند شرط را داشته باشد. ابتدا رویدادها باید از هم مستقل باشند. یعنی اتفاق افتادنِ یکی، بر دیگری تاثیری نداشته باشد. ثانیاً میانگین رویدادها در بازه‌ی زمانی ثابت باشد و در نهایت این‌که چند رویداد با هم اتفاق نیوفتند.

البته توزیع و فرآیندهای پواسون کاربردهای مختلف دیگری در رشته‌های فیزیک، شیمی و صنایع نیز دارند که برای پاسخگویی به سوالاتی مانند سوالات بالا، از این توزیعِ پرکاربرد استفاده می‌شود.

منابع این بحث و اطلاعات بیشتر

» وب‌سایت towardsdatascience

» وب‌سایت onlinemathlearning

در صورت تمایل به یادگیری بیشتر، منابع بالا در نظر گرفته شده است. می توانید با خواندن این منابع، به یادگیری خود در این زمینه عمق ببخشید

8 دیدگاه دربارهٔ «توزیع پواسون (Poisson Distribution)»

  1. سلام، واقعا خسته نباشید میگم. توضیحاتتون بسیار عالی و روان هست. کاش مطالب بیشتری تو این بخش راجب درس آمار و احتمال بذارید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *