ابر صفحه (Hyper Plane) در داده‌کاوی و طبقه‌بندی چیست؟

مدرس: مسعود کاویانی

مفهوم اَبَر صفحه را احتمالاً در کتاب‌های مختلفِ داده‌کاوی شنیده باشید. این مفهومی آشنا، مخصوصاً برای دانشجویانی است که با ماشینِ بردار پشتیبان (SVM) در طبقه‌بندی کارکرده باشند. اگر درسِ پرسپترون چگونه کار می‌کند را خوانده باشید (که پیشنهاد می‌کنم حتماً بخوانید) متوجه می‌شوید که کار بسیاری از الگوریتم‌های یادگیری ماشین و داده‌کاوی این است که یک خطِ جداساز بینِ داده‌ها رسم کنند تا به وسیله‌ی آن بتوانند تفاوت‌های اشیای مختلف را درک کنند. به زبانِ ساده  یادگیری ماشین تواناییِ درکِ همین تفاوت‌ها است.

مثالِ پراید و اتوبوس را از همان درس پرسپترون به یاد بیاورید:شبکه عصبی یادگیری ماشین

گفتیم که داده‌های تصویر بالا به صورت زیر بر روی دو بُعد نگاشت می‌شود و خط آبی رنگ وسط یک خط جدا کننده (separator) برای اتوبوس و پراید است:

پرسپترون شبکه عصبی

ما به دنبال ایجاد خطی بودیم که بتواند تفاوت پراید و اتوبوس را درک کند. در واقع یک خط جدا کننده. در مثالِ بالا ما دو بعد داشتیم (طول ماشین-محور افقی و ارتفاع ماشین-محور عمودی) که نقاط بر اساس آن در محور مختصات رسم شدند. ولی حالا فرض کنید فقط یک ویژگی داریم (یعنی فقط یک بعد به اسم ارتقاع داشته باشیم) و میخواهیم بین اتوبوس و پراید فقط با همین یک بُعد تمایز قائل شویم. مانند تصویر زیر:

در واقع همان‌طور که مشخص است ارتفاعِ اتوبوس‌ها معمولاً بیشتر از پراید‌ها هستند پس می‌توان فقط با یک نقطه (نقطه آبی رنگ در شکلِ بالا) تفاوت را مشخص کرد. در واقع نقطه‌ی آبی رنگ (عدد ۳) می‌تواند یک نقطه متمایز کننده بین اتوبوس و پراید باشد. همان‌طور که مشاهده می‌کنید، چون در اینجا فقط یک بُعد داریم، یک نقطه برای تمایز آن‌ها کافی است (البته اگر تمایز پذیر باشند). در مثال بالاتر دو بعد داشتیم، پس باید یک خطِ متمایز کننده داشته باشیم. حالا همان طور که حدس می‌زنید اگر ۳ بُعد داشته باشیم، نیاز به یک صفحه (plane) داریم تا بتواند تفکیک را در سه بعد، در صورت امکان برایمان بسازد. حالا اگر بیشتر از ۳ بُعد داشته باشیم مثلاً ۱۰ بُعد یا همان ۱۰ ویژگی داشته باشیم (که تصورِ آن در فضای ۳بعدی بر ما سخت است) برای تفکیک آن به چیزی بیشتر از یک صفحه نیاز داریم. برای اینکه بتوانید ۱۰ ویژگی را تصور کنید، فرض کنید در همان مثال پراید و اتوبوس به جای اینکه دو ویژگیِ طول و ارتفاع را داشته باشیم، می‌توانیم ۱۰ ویژگیِ مختلف را برای هر ماشین داشته باشیم. مثلاً ویژگی‌هایی مانند حداکثر دور موتور، ارتفاع لاستیک‌ها، حداکثر سرعت و… به ویژگی‌های ما اضافه شود. برای جداسازیِ پراید و اتوبوس در یک فضای ۱۰ بُعدی به یک حالتِ جدا کننده بیشتر از یک نقطه (مناسب برای فضای ۱ بعدی) یا خط (مناسب برای فضای ۲ بعدی) یا صفحه (مناسب برای فضای ۳ بعدی) نیاز داریم. این همان ابر صفحه یا Hyper Plane است که می‌تواند یک فضای بیشتر از ۳ بُعد را برای ما تفکیک دهد. پس اگر جایی در طبقه‌بند‌ها مخصوصاً طبقه‌بندِ SVM واژه‌ی اَبَر صفحه را شنیدید، منظور همین است.

3 دیدگاه دربارهٔ «ابر صفحه (Hyper Plane) در داده‌کاوی و طبقه‌بندی چیست؟»

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *