چرا ماتریس‌ها در علوم داده مهم هستند؟

مدرس: مسعود کاویانی

ماتریس‌ها یکی از عناصر اصلی در ریاضیات و جبرخطی هستند. بدون استفاده از ماتریس‌ها، نمی‌توان ساختارهای داده‌ای پیچیده و ترکیبی را ساخت. در علوم کامپیوتر و محاسبات هم ماتریس‌ها جایگاه ویژه‌ای دارند. عملیات محاسباتی سنگین مانند پردازش‌های گرافیک (مانند بازی‌ها یا ساخت انیمیشن‌ها) همه و همه از خاصیت پردازش ماتریس‌ها استفاده می‌کنند. کارت‌های گرافیک جدید هم به گونه‌ای طراحی شده‌اند که می‌توانند عملیات مختلف بر روی ماتریس‌های حجیم را در کسری از ثانیه اجرا کنند.

نقش ماتریس‌ها در علوم داده (data science) نیز غیر قابل انکار است. با استفاده از جبر رابطه‌ای (relational algebra) می‌توان هر گونه رابطه‌ای را در دنیای واقعی به جداول و ماتریس‌ها تبدیل کرد. برای مثال یک شرکت تولید لوازم خانگی را در نظر بگیرید که می‌خواهد اطلاعات مشتریان خود را در جدول یا ماتریسی ذخیره کند. چیزی مانند شکل زیر:

اگر به ماتریس بالا نگاه کنید، در هر سطر یک مشتری را ذخیره کرده‌ایم. هر ستون نشان دهنده‌ی یک «ویژگی» است. برای مثال شخص شماره‌ی ۱ را در نظر بگیرید. این شخص ۴۰ ساله است و دو فرزند دارد. یک یخچال از شرکت به قیمت ۲۰ میلیون تومان خریده است. همچنین ۲ مرتبه از گارانتی استفاده کرده است. همان‌طور که مشاهده می‌کنید تمامی افراد (سطرها) همه‌ی این ویژگی‌ها (ستون‌ها) را دارند. در اینجا ما مشتریان خود را به یک ماتریس (جدول) تبدیل کرده‌ایم و می‌توانیم با کمک این ساختار، داده‌های خود را ذخیره کنیم.

اگر با نرم‌افزارهای صفحه‌ی گسترده مانند Excel و یا سیستم‌های مدیریت پایگاه داده مانند Sql Server کار کرده باشید، حتما متوجه شده‌اید که این نرم‌افزارها هم از همین روش جبر رابطه‌ای (linear algebra) برای ذخیره سازی و بازیابی اطلاعات خود استفاده می‌کنند. همچنین بسیاری از الگوریتم‌های داده‌کاوی (data mining) و یادگیری ماشین (machine learning) هم برای اجرا و یادگیری الگو، از ورودی‌های ماتریس استفاده می‌کنند.

به طور کلی ماتریس عنصری است که برای سازماندهی به اعداد و مدل‌سازی مفاهیم پیچیده با استفاده از ریاضیات استفاده می‌شود. با استفاده از ماتریس‌ها، ما می‌توانیم تقریباً همه‌ی عناصر موجود در طبیعت را در کامپیوتر ذخیره کرده و آن‌ها را پردازش کنیم. نوع پیچیده‌تری از ماتریس نیز وجود دارد که به آن تنسور (tensor) می‌گویند که در دروس قبلی در مورد این عنصر صحبت کردیم.

2 دیدگاه دربارهٔ «چرا ماتریس‌ها در علوم داده مهم هستند؟»

  1. سلام و تشکر از آموزش مختصر و مفیدتون،
    جبر رابطه‌ای (linear algebra) یا جبر خطی؟ آیا در متن بالا صحیح است؟

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *