متغیر تصادفی (Random Variable)، تابع توزیع احتمال (PDF) و تابع توزیع تجمعی (CDF)

مدرس: مسعود کاویانی

فرض کنید یک سکه را بالا می‌اندازید. به احتمال ۵۰ درصد این سکه رو (head) می‌آید و به احتمال ۵۰ درصد این سکه پشت (tail). اگر این احتمال را با x نشان دهیم به این x یک متغیر تصادفی می‌گویند. متغیر (variable) به خاطر این‌که می‌تواند تغییر کند و تصادفی (random) به خاطر این‌که مبتنی بر شانس و تصادف است. مثال دیگر از متغیر تصادفی، می‌تواند قدِ افراد باشد. برای مثال فرض کنید متغیر x قدِ افرادِ مختلف در یک جامعه است. برای مثال شما یک نفر را از میان جامعه انتخاب می‌کنید و می‌توانید بر اساس احتمالات، مثلاً حدس بزنید که به احتمال ۲۰ درصد، قدِ این شخص بین ۱۷۰ تا ۱۸۰ سانتی‌متر است. این حالتِ دوم کمی پیچیده‌تر از مثالِ سکه شد ولی به هر حال به این متغیر هم، یک متغیر تصادفی می‌گویند.

تفاوت مثالِ سکه با مثالِ قد، این است که در مثالِ سکه، متغیرِ تصادفیِ ما، گسسته (discrete) بوده ولی در مثال قد، این متغیر تصادفی پیوسته (continuous) است. گسسته به این معنا که مثلاً در مثال سکه، متغیر x فقط مقادیر مشخصی مانند رو یا پشت (head or tail) را قبول می‌کند و بین این دو مقدار را نمی‌تواند بپذیرد. ولی در مثالِ قدِ افرادِ جامعه که متغیر x یک متغیر پیوسته بود، مقادیر می‌توانستند در یک بازه‌ی مشخص بوده و هر مقداری بین این بازه هم می‌تواند در مقادیر قرار بگیرد. مثلاً قدِ یک فرد می‌تواند در بازه‌ی ۰ تا ۲۵۰ سانتی‌متر باشد. برای مثال ۱۸۰.۳۲۱۳ سانتی‌متر نیز یک قدِ معتبر است.

خب، تا این‌جا مفهومِ متغیرِ تصادفی را آموختیم. حالا می‌خواهیم با دو مفهومِ ساده‌ی دیگر آشنا شویم. اولین مفهوم تابعِ توزیع تجمعی یا همان cumulative distribution function یا به اختصار CDF است. فرض کنید متغیر تصادفیِ ما در این‌جا یک تاس باشد. می‌دانید که در هر پرتاب، یک تاس می‌تواند به صورت تصادفی بین ۱ تا ۶ بیاید و احتمالِ مشاهده‌ی هر کدام از اعدادِ ۱تا ۶ در هر پرتاب،«یک ششم» است. حالا به شکل زیر نگاه کنید:

محور عمودی در این شکل، احتمال تجمعی بوده و محور افقی همان متغیر تصادفیِ ماست (x). برای مثال احتمال این‌که با پرتاب تاس، عدد مشاهده شده کوچکتر از ۱ بیاید طبیعتاً صفر است، یعنی اگر محور افقی – x – را برابر ۱ قرار دهیم، در محور عمودی عدد صفر مشخص می‌شود. و احتمال این‌که عدد مشاهده شده کمتر از ۲ باشد (یعنی x کمتر از ۲ باشد)، حدوداً ۱۶.۶۷ (یک ششم) درصد است چون فقط عدد ۱ می‌تواند مشاهده شود. مشاهده می‌کنید که احتمالِ این‌که عدد مشاهده شده در پرتابِ یک تاس کمتر از ۳ باشد (یعنی یا ۱ باشد یا ۲) برابرِ تجمیعِ احتمالات مشاهده‌ی ۱ و ۲ است که برابر ۲ * ۱۶.۶۷ = ۳۳.۳۴ می‌شود. یادتان هست که احتمال مشاهده‌ی هر کدام از اعداد در یک پرتاب تاس برابر ۱۶.۶۷ درصد (یک ششم) بود. به تابعی که بتواند شکل بالا را رسم کند، CDF یا تابعِ توزیع تجمعی می‌گویند. در واقع یک عدد، مثلاً ۳ در مثال پرتاب تاس را به این تابع می‌دهیم و این تابع مقدار ۳۳.۳۴ که جمع تمامیِ احتمالاتِ کوچک‌تر از ۳ هست را به ما برمی‌گرداند.

مفهوم آخری که در این درس به آن می‌پردازیم، تابع توزیع احتمال یا همان PDF است. برای درکِ این تابع، فرض کنید قدِ مردانِ یک جامعه را به دست آورده و با توجه به قدِ این افراد، نمودار زیر را رسم می‌کنیم:

تابع توزیع احتمال

در نمودار بالا، محور عمودی توزیع احتمال بوده و محور افقی همان متغیر تصادفی است (x). برای مثال در شکل بالا، قدِ ۱۷۷ سانتی‌متر را در نظر بگیرید. محور عمودی در این نقطه، برابر ۵۰ درصد است. به این معنی که ۵۰ درصد از افراد این جامعه قدی کمتر از ۱۷۷ سانتی‌متر دارند. به تابعی که بتواند خطی مانند بالا را برای ما رسم کند PDF یا تابع توزیع احتمال می‌گویند. این تابع همچنین می‌تواند احتمالات را برای مقادیر بازه‌ای مشخص کند. برای مثال احتمال این‌که قد شخصی بین ۱۲۰ تا ۱۶۰ (P(120 < x < 160 سانتی‌متر باشد چقدر است؟ یا احتمال این‌که در این جامعه قد شخصی، بیشتر از ۲ متر باشد چقدر است؟ در واقع قسمت حاشور خورده که مساحت زیر نمودار است، احتمال آن قسمت را مشخص می‌کند. حتماً توجه دارید که مساحت زیر نمودار به صورت کلی برابر ۱ خواهد بود. چون هیچ احتمالی نمی‌تواند بیشتر از ۱ باشد.

این دست از احتمالات می‌تواند برای شناخت اولیه داده و همچنین پاسخ به برخی از مسائلِ ابتدایی در میان داده‌ها کمک کند. برای مثال آنالیز اکتشافی داده می‌تواند توسط این توابع ارزیابی و بررسی شده و به تحلیل‌گرانِ داده این امکان را بدهد تا بتوانند به سادگی به مجموعه داده‌های خود تحلیل کنند.

منابع این بحث و اطلاعات بیشتر

» وب‌سایت statisticalhowto

» دانشگاه utah

 

در صورت تمایل به یادگیری بیشتر، منابع بالا در نظر گرفته شده است. می توانید با خواندن این منابع، به یادگیری خود در این زمینه عمق ببخشید

19 دیدگاه دربارهٔ «متغیر تصادفی (Random Variable)، تابع توزیع احتمال (PDF) و تابع توزیع تجمعی (CDF)»

  1. کاش هر کسی که توانایی درک روشن از مطالب علمی را دارد راه شما را پی بگیرد . خدا قوت یکی از نظر دهنده گان راست گفته خیر عملتان مطمئن به سمت شما باز می گردد. یا حق

  2. باسلام و تشکر…فوق العاده به زیان خیلی ساده تشریح کردید مطالب رو…من فیلمهای مختلف دانشگاهی دیده بودم. اما اینجا یه چیز دیگه بود…با آرزوی موفقیت روز افزون برای مجموعه تون

    1. تشکر استاد گرامی که به سئوالات بی پاسخ من به صورت واضح پاسخ دادید شما قلبا و فوق العاده آموزش میدهید و امیدوارم که همیشه موفق و پیروز باشید

  3. فوق العاده روان و عالی
    واقعا تسلط روی مباحث یعنی وقتی که بتونی اونو به صورت ساده توضیح بدی رو شما معنی کردید.
    ممنونم از شما

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *