متغیر تصادفی (Random Variable)، تابع توزیع احتمال (PDF) و تابع توزیع تجمعی (CDF) | چیستیو

این درس از مجموعه دوره توزیع احتمال (Probability Distribution) و کاربردهای آن است

درس بعدی - توزیع نرمال (Normal Distribution) یا توزیع گوسی (Gaussian Distribution)

مدرس: مسعود کاویانی

فرض کنید یک سکه را بالا می‌اندازید. به احتمال ۵۰ درصد این سکه رو (head) می‌آید و به احتمال ۵۰ درصد این سکه پشت (tail). اگر این احتمال را با x نشان دهیم به این x یک متغیر تصادفی می‌گویند. متغیر (variable) به خاطر این‌که می‌تواند تغییر کند و تصادفی (random) به خاطر این‌که مبتنی بر شانس و تصادف است. مثال دیگر از متغیر تصادفی، می‌تواند قدِ افراد باشد. برای مثال فرض کنید متغیر x قدِ افرادِ مختلف در یک جامعه است. برای مثال شما یک نفر را از میان جامعه انتخاب می‌کنید و می‌توانید بر اساس احتمالات، مثلاً حدس بزنید که به احتمال ۲۰ درصد، قدِ این شخص بین ۱۷۰ تا ۱۸۰ سانتی‌متر است. این حالتِ دوم کمی پیچیده‌تر از مثالِ سکه شد ولی به هر حال به این متغیر هم، یک متغیر تصادفی می‌گویند.

تفاوت مثالِ سکه با مثالِ قد، این است که در مثالِ سکه، متغیرِ تصادفیِ ما، گسسته (discrete) بوده ولی در مثال قد، این متغیر تصادفی پیوسته (continuous) است. گسسته به این معنا که مثلاً در مثال سکه، متغیر x فقط مقادیر مشخصی مانند رو یا پشت (head or tail) را قبول می‌کند و بین این دو مقدار را نمی‌تواند بپذیرد. ولی در مثالِ قدِ افرادِ جامعه که متغیر x یک متغیر پیوسته بود، مقادیر می‌توانستند در یک بازه‌ی مشخص بوده و هر مقداری بین این بازه هم می‌تواند در مقادیر قرار بگیرد. مثلاً قدِ یک فرد می‌تواند در بازه‌ی ۰ تا ۲۵۰ سانتی‌متر باشد. برای مثال ۱۸۰.۳۲۱۳ سانتی‌متر نیز یک قدِ معتبر است.

خب، تا این‌جا مفهومِ متغیرِ تصادفی را آموختیم. حالا می‌خواهیم با دو مفهومِ ساده‌ی دیگر آشنا شویم. اولین مفهوم تابعِ توزیع تجمعی یا همان cumulative distribution function یا به اختصار CDF است. فرض کنید متغیر تصادفیِ ما در این‌جا یک تاس باشد. می‌دانید که در هر پرتاب، یک تاس می‌تواند به صورت تصادفی بین ۱ تا ۶ بیاید و احتمالِ مشاهده‌ی هر کدام از اعدادِ ۱تا ۶ در هر پرتاب،«یک ششم» است. حالا به شکل زیر نگاه کنید:

محور عمودی در این شکل، احتمال تجمعی بوده و محور افقی همان متغیر تصادفیِ ماست (x). برای مثال احتمال این‌که با پرتاب تاس، عدد مشاهده شده کوچکتر از ۱ بیاید طبیعتاً صفر است، یعنی اگر محور افقی – x – را برابر ۱ قرار دهیم، در محور عمودی عدد صفر مشخص می‌شود. و احتمال این‌که عدد مشاهده شده کمتر از ۲ باشد (یعنی x کمتر از ۲ باشد)، حدوداً ۱۶.۶۷ (یک ششم) درصد است چون فقط عدد ۱ می‌تواند مشاهده شود. مشاهده می‌کنید که احتمالِ این‌که عدد مشاهده شده در پرتابِ یک تاس کمتر از ۳ باشد (یعنی یا ۱ باشد یا ۲) برابرِ تجمیعِ احتمالات مشاهده‌ی ۱ و ۲ است که برابر ۲ * ۱۶.۶۷ = ۳۳.۳۴ می‌شود. یادتان هست که احتمال مشاهده‌ی هر کدام از اعداد در یک پرتاب تاس برابر ۱۶.۶۷ درصد (یک ششم) بود. به تابعی که بتواند شکل بالا را رسم کند، CDF یا تابعِ توزیع تجمعی می‌گویند. در واقع یک عدد، مثلاً ۳ در مثال پرتاب تاس را به این تابع می‌دهیم و این تابع مقدار ۳۳.۳۴ که جمع تمامیِ احتمالاتِ کوچک‌تر از ۳ هست را به ما برمی‌گرداند.

مفهوم آخری که در این درس به آن می‌پردازیم، تابع توزیع احتمال یا همان PDF است. برای درکِ این تابع، فرض کنید قدِ مردانِ یک جامعه را به دست آورده و با توجه به قدِ این افراد، نمودار زیر را رسم می‌کنیم:

در نمودار بالا، محور عمودی توزیع احتمال بوده و محور افقی همان متغیر تصادفی است (x). برای مثال در شکل بالا، قدِ ۱۷۷ سانتی‌متر را در نظر بگیرید. محور عمودی در این نقطه، برابر ۵۰ درصد است. به این معنی که ۵۰ درصد از افراد این جامعه قدی کمتر از ۱۷۷ سانتی‌متر دارند. به تابعی که بتواند خطی مانند بالا را برای ما رسم کند PDF یا تابع توزیع احتمال می‌گویند. این تابع همچنین می‌تواند احتمالات را برای مقادیر بازه‌ای مشخص کند. برای مثال احتمال این‌که قد شخصی بین ۱۲۰ تا ۱۶۰ (P(120 < x < 160 سانتی‌متر باشد چقدر است؟ یا احتمال این‌که در این جامعه قد شخصی، بیشتر از ۲ متر باشد چقدر است؟ در واقع قسمت حاشور خورده که مساحت زیر نمودار است، احتمال آن قسمت را مشخص می‌کند. حتماً توجه دارید که مساحت زیر نمودار به صورت کلی برابر ۱ خواهد بود. چون هیچ احتمالی نمی‌تواند بیشتر از ۱ باشد.

این دست از احتمالات می‌تواند برای شناخت اولیه داده و همچنین پاسخ به برخی از مسائلِ ابتدایی در میان داده‌ها کمک کند. برای مثال آنالیز اکتشافی داده می‌تواند توسط این توابع ارزیابی و بررسی شده و به تحلیل‌گرانِ داده این امکان را بدهد تا بتوانند به سادگی به مجموعه داده‌های خود تحلیل کنند.

این درس از مجموعه دوره توزیع احتمال (Probability Distribution) و کاربردهای آن است

ترتیب پیشنهادی خواندن درس‌های این مجموعه به صورت زیر است:

19 دیدگاه دربارهٔ «متغیر تصادفی (Random Variable)، تابع توزیع احتمال (PDF) و تابع توزیع تجمعی (CDF)»

کاش هر کسی که توانایی درک روشن از مطالب علمی را دارد راه شما را پی بگیرد . خدا قوت یکی از نظر دهنده گان راست گفته خیر عملتان مطمئن به سمت شما باز می گردد. یا حق

19 دیدگاه دربارهٔ «متغیر تصادفی (Random Variable)، تابع توزیع احتمال (PDF) و تابع توزیع تجمعی (CDF)»

دیدگاهتان را بنویسید لغو پاسخ