فاصله‌ی جنسون-شنون (Jenson-Shannon) برای مقایسه‌ی توزیع‌های آماری

مدرس: مسعود کاویانی

در درس گذشته در مورد واگرایی کولبک-لیبلر صحبت کردیم و گفتیم که این معیار واگرایی می‌تواند شباهت دو توزیع آماری را نمایش دهد. فاصله‌ی جنسون-شنون (Jenson-Shannon) نیز مانند کولبک-لیبلر رفتار می‌کند با این تفاوت که این فاصله بین دو توزیع آماری، تقارن دارد. یعنی فاصله‌ی توزیعِ اول و دوم برابر با فاصله‌ی توزیع دوم و اول است در حالی که در واگرایی کولبک-لیبلر این خاصیت برقرار نیست.

فرض کنید داده‌هایی شبیه به مثال قبل در درسِ کولبک-لیبلر داریم. در این داده‌ها فرض بر این است که در دانشگاهی هستیم و یک استاد مدعو برای درس مبانی کامپیوتر به دانشگاه می‌آید. می‌خواهیم ببینیم که آیا نمراتی که این استادِ مدعو به دانشجویان می‌دهد با استادِ اصلی این درس که هیئت علمی دانشگاه بوده و در ترم‌های گذشته درس مبانی کامپیوتر را تدریس می‌کرده، تفاوتی دارد یا خیر. برای این کار دو مجموعه‌ی داده از نمرات درس مبانی کامپیوتر در دو گروه دانشجویان جمع‌آوری می‌کنیم. گروه اول دانشجویانِ استاد اصلی درس (A) و گروه دوم دانشجویان استاد مدعو (B) در درس مبانی کامپیوتر هستند و توزیع نمرات هر گروه در شکل زیر مشخص شده است:

داده‌های بالا مانند درسِ قبلی به حالت احتمالی تبدیل شده‌اند. حال اگر بخواهیم فاصله‌ی بین توزیعِ نمراتِ کسب شده توسط استادِ اول (A) و استادِ دوم (B) را بسنجیم، علاوه بر فرمولِ کولبک-لیبلر، می‌توانیم از فرمول جنسون-شنون نیز استفاده کنیم. این فرمول از واگرایی کولبک-لیبر استفاده می‌کند:

در واقع فاصله‌ی جنسون-شنون برابر با جمعِ وزنیِ واگرایی کولبک-لیبلر است. با این کار، معیار جنسون شنون تبدیل به یک معیار فاصله شده که قابلیت تفارن دارد. یعنی فاصله‌ی بین توزیع الف و ب برابر با فاصله‌ی بین توزیع ب و الف است.

هر کدام از معیارهای جنسون-شنون یا کولبک-لیبلر در مسائل مختلف می‌توانند مورد استفاده قرار بگیرند. معمولاً اگر تعداد ویژگی‌ها (ابعاد) مسئله بالا باشد بهتر است از جنسون-شنون به جای کولبک-لیبلر استفاده شود. برای مثال در شبکه‌های عصبی عمیق مولد متخاصم (که در دوره‌های آینده به آن خواهیم پرداخت) از معیار جنسون-شنون استفاده می‌شود.

ترتیب پیشنهادی خواندن درس‌های این مجموعه به صورت زیر است:
منابع این بحث و اطلاعات بیشتر

» وب‌سایت notesonai

در صورت تمایل به یادگیری بیشتر، منابع بالا در نظر گرفته شده است. می توانید با خواندن این منابع، به یادگیری خود در این زمینه عمق ببخشید

2 دیدگاه دربارهٔ «فاصله‌ی جنسون-شنون (Jenson-Shannon) برای مقایسه‌ی توزیع‌های آماری»

  1. سلام ممنونم
    اگر یک نمودار از این فاصله‌ی جنسون-شنون
    برای این نمونه مثال “نمرات دانشجو ها” هم قرار میدادین خیلی بهتر می شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *