فرض کنید یک سکه را بالا میاندازید. به احتمال ۵۰ درصد این سکه رو (head) میآید و به احتمال ۵۰ درصد این سکه پشت (tail). اگر این احتمال را با x نشان دهیم به این x یک متغیر تصادفی میگویند. متغیر (variable) به خاطر اینکه میتواند تغییر کند و تصادفی (random) به خاطر اینکه مبتنی بر شانس و تصادف است. مثال دیگر از متغیر تصادفی، میتواند قدِ افراد باشد. برای مثال فرض کنید متغیر x قدِ افرادِ مختلف در یک جامعه است. برای مثال شما یک نفر را از میان جامعه انتخاب میکنید و میتوانید بر اساس احتمالات، مثلاً حدس بزنید که به احتمال ۲۰ درصد، قدِ این شخص بین ۱۷۰ تا ۱۸۰ سانتیمتر است. این حالتِ دوم کمی پیچیدهتر از مثالِ سکه شد ولی به هر حال به این متغیر هم، یک متغیر تصادفی میگویند.
تفاوت مثالِ سکه با مثالِ قد، این است که در مثالِ سکه، متغیرِ تصادفیِ ما، گسسته (discrete) بوده ولی در مثال قد، این متغیر تصادفی پیوسته (continuous) است. گسسته به این معنا که مثلاً در مثال سکه، متغیر x فقط مقادیر مشخصی مانند رو یا پشت (head or tail) را قبول میکند و بین این دو مقدار را نمیتواند بپذیرد. ولی در مثالِ قدِ افرادِ جامعه که متغیر x یک متغیر پیوسته بود، مقادیر میتوانستند در یک بازهی مشخص بوده و هر مقداری بین این بازه هم میتواند در مقادیر قرار بگیرد. مثلاً قدِ یک فرد میتواند در بازهی ۰ تا ۲۵۰ سانتیمتر باشد. برای مثال ۱۸۰.۳۲۱۳ سانتیمتر نیز یک قدِ معتبر است.
خب، تا اینجا مفهومِ متغیرِ تصادفی را آموختیم. حالا میخواهیم با دو مفهومِ سادهی دیگر آشنا شویم. اولین مفهوم تابعِ توزیع تجمعی یا همان cumulative distribution function یا به اختصار CDF است. فرض کنید متغیر تصادفیِ ما در اینجا یک تاس باشد. میدانید که در هر پرتاب، یک تاس میتواند به صورت تصادفی بین ۱ تا ۶ بیاید و احتمالِ مشاهدهی هر کدام از اعدادِ ۱تا ۶ در هر پرتاب،«یک ششم» است. حالا به شکل زیر نگاه کنید:
محور عمودی در این شکل، احتمال تجمعی بوده و محور افقی همان متغیر تصادفیِ ماست (x). برای مثال احتمال اینکه با پرتاب تاس، عدد مشاهده شده کوچکتر از ۱ بیاید طبیعتاً صفر است، یعنی اگر محور افقی – x – را برابر ۱ قرار دهیم، در محور عمودی عدد صفر مشخص میشود. و احتمال اینکه عدد مشاهده شده کمتر از ۲ باشد (یعنی x کمتر از ۲ باشد)، حدوداً ۱۶.۶۷ (یک ششم) درصد است چون فقط عدد ۱ میتواند مشاهده شود. مشاهده میکنید که احتمالِ اینکه عدد مشاهده شده در پرتابِ یک تاس کمتر از ۳ باشد (یعنی یا ۱ باشد یا ۲) برابرِ تجمیعِ احتمالات مشاهدهی ۱ و ۲ است که برابر ۲ * ۱۶.۶۷ = ۳۳.۳۴ میشود. یادتان هست که احتمال مشاهدهی هر کدام از اعداد در یک پرتاب تاس برابر ۱۶.۶۷ درصد (یک ششم) بود. به تابعی که بتواند شکل بالا را رسم کند، CDF یا تابعِ توزیع تجمعی میگویند. در واقع یک عدد، مثلاً ۳ در مثال پرتاب تاس را به این تابع میدهیم و این تابع مقدار ۳۳.۳۴ که جمع تمامیِ احتمالاتِ کوچکتر از ۳ هست را به ما برمیگرداند.
مفهوم آخری که در این درس به آن میپردازیم، تابع توزیع احتمال یا همان PDF است. برای درکِ این تابع، فرض کنید قدِ مردانِ یک جامعه را به دست آورده و با توجه به قدِ این افراد، نمودار زیر را رسم میکنیم:
در نمودار بالا، محور عمودی توزیع احتمال بوده و محور افقی همان متغیر تصادفی است (x). برای مثال در شکل بالا، قدِ ۱۷۷ سانتیمتر را در نظر بگیرید. محور عمودی در این نقطه، برابر ۵۰ درصد است. به این معنی که ۵۰ درصد از افراد این جامعه قدی کمتر از ۱۷۷ سانتیمتر دارند. به تابعی که بتواند خطی مانند بالا را برای ما رسم کند PDF یا تابع توزیع احتمال میگویند. این تابع همچنین میتواند احتمالات را برای مقادیر بازهای مشخص کند. برای مثال احتمال اینکه قد شخصی بین ۱۲۰ تا ۱۶۰ (P(120 < x < 160 سانتیمتر باشد چقدر است؟ یا احتمال اینکه در این جامعه قد شخصی، بیشتر از ۲ متر باشد چقدر است؟ در واقع قسمت حاشور خورده که مساحت زیر نمودار است، احتمال آن قسمت را مشخص میکند. حتماً توجه دارید که مساحت زیر نمودار به صورت کلی برابر ۱ خواهد بود. چون هیچ احتمالی نمیتواند بیشتر از ۱ باشد.
این دست از احتمالات میتواند برای شناخت اولیه داده و همچنین پاسخ به برخی از مسائلِ ابتدایی در میان دادهها کمک کند. برای مثال آنالیز اکتشافی داده میتواند توسط این توابع ارزیابی و بررسی شده و به تحلیلگرانِ داده این امکان را بدهد تا بتوانند به سادگی به مجموعه دادههای خود تحلیل کنند.
- ۱ » متغیر تصادفی (Random Variable)، تابع توزیع احتمال (PDF) و تابع توزیع تجمعی (CDF)
- ۲ » توزیع نرمال (Normal Distribution) یا توزیع گوسی (Gaussian Distribution)
- ۳ » چگونه بفهمیم دادههای ما از توزیع نرمال پیروی میکند یا خیر؟
- ۴ » توزیع یکنواخت (Uniform Distribution) و کاربردهای آن
- ۵ » توزیع برنولی (Bernoulli Distribution) و توزیع دو جملهای (Binomial Distribution)
- ۶ » توزیع پواسون (Poisson Distribution)
- ۷ » توزیع نمایی (Exponential Distribution)
- ۸ » آزمون برازش Chi-Square برای توزیعهای احتمال
- ۹ » توزیع گاما (Gamma Distribution)
کاش هر کسی که توانایی درک روشن از مطالب علمی را دارد راه شما را پی بگیرد . خدا قوت یکی از نظر دهنده گان راست گفته خیر عملتان مطمئن به سمت شما باز می گردد. یا حق
توضیح های شما بی نظیره
خیلی ممنون.
سلام وقت بخیر، بااینکه کلاس های کنکور هم شرکت کرده بودم اما باز هم به این وضوح توضیح نداده بودن.
سلام،وقتتون بخیر،یه سوال داشتم؟
سلام، بفرمایید سوالتون رو
فقط من متوجه نشدم چرا یک ششم حدودا شد ۱۶.۶۷
مرسی از سایت خوبتون.
۱۰۰ تقسیم بر ۶ میشه ۱۶/۶۷
در واقع از صد در صد حساب میشه
سلام
تشکر به خاطر زحماتتون
فقط به یک نکته برخوردم که تابعCDF همواره غیر نزولی است.
باسلام و تشکر…فوق العاده به زیان خیلی ساده تشریح کردید مطالب رو…من فیلمهای مختلف دانشگاهی دیده بودم. اما اینجا یه چیز دیگه بود…با آرزوی موفقیت روز افزون برای مجموعه تون
سلام
cululative یا cumulative ?
فکر کنم متن ایراد داره
حاشور نیاز به اصلاح داره..هاشور صحیح تر هست
Cumulative , not cululative
ممنون
اصلاح شد
واقعا عالی و جایی ندیدم به این راحتی توضیح داده باشد
تشکر استاد گرامی که به سئوالات بی پاسخ من به صورت واضح پاسخ دادید شما قلبا و فوق العاده آموزش میدهید و امیدوارم که همیشه موفق و پیروز باشید
عالی و روان بود توضیحاتتون.مرسی
خیلی مفید بود برای من خیلی روان و ساده بیان شده
عالی
فوق العاده روان و عالی
واقعا تسلط روی مباحث یعنی وقتی که بتونی اونو به صورت ساده توضیح بدی رو شما معنی کردید.
ممنونم از شما