مفهوم اَبَر صفحه را احتمالاً در کتابهای مختلفِ دادهکاوی شنیده باشید. این مفهومی آشنا، مخصوصاً برای دانشجویانی است که با ماشینِ بردار پشتیبان (SVM) در طبقهبندی کارکرده باشند. اگر درسِ پرسپترون چگونه کار میکند را خوانده باشید (که پیشنهاد میکنم حتماً بخوانید) متوجه میشوید که کار بسیاری از الگوریتمهای یادگیری ماشین و دادهکاوی این است که یک خطِ جداساز بینِ دادهها رسم کنند تا به وسیلهی آن بتوانند تفاوتهای اشیای مختلف را درک کنند. به زبانِ ساده یادگیری ماشین تواناییِ درکِ همین تفاوتها است.
مثالِ پراید و اتوبوس را از همان درس پرسپترون به یاد بیاورید:
گفتیم که دادههای تصویر بالا به صورت زیر بر روی دو بُعد نگاشت میشود و خط آبی رنگ وسط یک خط جدا کننده (separator) برای اتوبوس و پراید است:
ما به دنبال ایجاد خطی بودیم که بتواند تفاوت پراید و اتوبوس را درک کند. در واقع یک خط جدا کننده. در مثالِ بالا ما دو بعد داشتیم (طول ماشین-محور افقی و ارتفاع ماشین-محور عمودی) که نقاط بر اساس آن در محور مختصات رسم شدند. ولی حالا فرض کنید فقط یک ویژگی داریم (یعنی فقط یک بعد به اسم ارتقاع داشته باشیم) و میخواهیم بین اتوبوس و پراید فقط با همین یک بُعد تمایز قائل شویم. مانند تصویر زیر:
در واقع همانطور که مشخص است ارتفاعِ اتوبوسها معمولاً بیشتر از پرایدها هستند پس میتوان فقط با یک نقطه (نقطه آبی رنگ در شکلِ بالا) تفاوت را مشخص کرد. در واقع نقطهی آبی رنگ (عدد ۳) میتواند یک نقطه متمایز کننده بین اتوبوس و پراید باشد. همانطور که مشاهده میکنید، چون در اینجا فقط یک بُعد داریم، یک نقطه برای تمایز آنها کافی است (البته اگر تمایز پذیر باشند). در مثال بالاتر دو بعد داشتیم، پس باید یک خطِ متمایز کننده داشته باشیم. حالا همان طور که حدس میزنید اگر ۳ بُعد داشته باشیم، نیاز به یک صفحه (plane) داریم تا بتواند تفکیک را در سه بعد، در صورت امکان برایمان بسازد. حالا اگر بیشتر از ۳ بُعد داشته باشیم مثلاً ۱۰ بُعد یا همان ۱۰ ویژگی داشته باشیم (که تصورِ آن در فضای ۳بعدی بر ما سخت است) برای تفکیک آن به چیزی بیشتر از یک صفحه نیاز داریم. برای اینکه بتوانید ۱۰ ویژگی را تصور کنید، فرض کنید در همان مثال پراید و اتوبوس به جای اینکه دو ویژگیِ طول و ارتفاع را داشته باشیم، میتوانیم ۱۰ ویژگیِ مختلف را برای هر ماشین داشته باشیم. مثلاً ویژگیهایی مانند حداکثر دور موتور، ارتفاع لاستیکها، حداکثر سرعت و… به ویژگیهای ما اضافه شود. برای جداسازیِ پراید و اتوبوس در یک فضای ۱۰ بُعدی به یک حالتِ جدا کننده بیشتر از یک نقطه (مناسب برای فضای ۱ بعدی) یا خط (مناسب برای فضای ۲ بعدی) یا صفحه (مناسب برای فضای ۳ بعدی) نیاز داریم. این همان ابر صفحه یا Hyper Plane است که میتواند یک فضای بیشتر از ۳ بُعد را برای ما تفکیک دهد. پس اگر جایی در طبقهبندها مخصوصاً طبقهبندِ SVM واژهی اَبَر صفحه را شنیدید، منظور همین است.
ساده و عالی بود
ممنون از توضیح خوب شما
چقدر خلاصه و مفید. ممنون.