چرا باید کلان‌داده‌ (Big Data) را جدی بگیریم؟

مدرس: مسعود کاویانی

در دو درسِ قبلیِ این دوره مقدماتی را در مورد کلان‌داده گفتیم و یک مثالِ کاربردی در حوزه‌ی پزشکی را هم با هم مرور کردیم. اما بیایید ببینیم چرا کلان‌داده یا همان Big Data جزو حوزه‌های بسیار پربحث در علوم جدید شده است که بسیاری از افراد و مهندسان در رشته‌های گوناگون به سراغ آن رفته‌اند. برای مثال دوره‌ای که دانشگاه هاروارد در حوزه علوم‌داده برگزار کرد، نزدیک به ۴۰۰دانشجو از رشته‌های مختلفِ مهندسی، تجارت، پزشکی و حتی طراحی را به خود جذب کرد.

امروزه داده‌ها به صورت فراوان در حال تولید هستند. همین که شما یک تراکنش با کارت بانکی انجام می‌دهید یا یک تماس تلفنی از طریقِ موبایل خود می‌گیرید، داده تولید می‌کنید. در واقع طبقِ گفته آقای Gray King یک انقلاب در کلان‌داده رخ داده است. اما این بدین معنا نیست که فقط داده‌های زیادی در حال تولید و جمع‌آوری هستند، بلکه به این معنی است که می‌توان این داده‌ها را پردازش کرد و اطلاعات و ارزش‌های مختلفی را از بین این داده‌ها استخراج نمود.

در واقع یکی از دلایلِ این انقلاب را می‌توان در رشد الگوریتم‌های کامپیوتری و روش‌های پردازشی دانست. شاید فکر کنید که ظرفیت پردازش داده‌ها و ظرفیت نگهداری آن‌ها زیاد شده است. ولی این در مقابلِ رشد الگوریتم‌ها و روش‌های پردازش شاید کمتر باعث این انقلاب شده باشد. در واقع طبق تحقیقاتی که آقای King و دانشجویان او انجام دادند، مسئله‌ای که نیاز به یک کامپیوتر ۲میلیون دلاری برای حل داشت، با یک الگوریتم خوب توانست در مدت ۲۰دقیقه بر روی یک لپ تاپ پردازش و حل شود. در واقع این قدرت الگوریتم‌ها و روش‌های پردازشی را برای ما اثبات می‌کند و این خود یک انقلاب در حوزه داده است.

در دانشگاهِ هاروارد مرکزی به نام IQSS دایر است که در واقع محلی برای انجامِ پروژه‌های بین رشته‌ای برای حل مشکلات جوامع می‌باشد. مثلا پروژه‌ای که در آن هم باید مهندسان مکانیک حضور داشته باشند و هم مهندسانِ علم‌داده می‌توانند در این مرکز به انجام پروژه و حل مسئله کمک کنند. طبقِ صحبت آقای King، درصد بالایی از دانشکده‌ها و گروه‌های حقوق، جامعه‌شناسی، اقتصاد و پزشکی از آنالیز داده‌ها برای حل مسئله‌هایشان استفاده می‌کردند. این نشان می‌دهد که پردازشِ داده‌های زیاد و کلان‌داده‌ها به سرعت در تمامی رشته‌ها نفوذ کرده است به طوری که به سختی می‌توان رشته‌ای را یافت که علوم داده و آنالیز داده‌ها به آن کمکی نکنند.

اجازه بدهید چند مثال ساده را با هم مرور کنیم:

یکی از کاربرد‌های کلان‌داده‌ در حوزه بازاریابی (Marketing) را می‌توان سیستم‌های پیشنهاد دهنده (یا سیستم‌های توصیه گر) یا همان Recommended Systems دانست. در مورد این سیستم‌ها در درسِ سیستم‌های توصیه‌گر صحبت‌هایی کردیم. این سیستم‌ها با توجه به روند‌های مختلف و الگوهایی که از مشتریانِ قبلی به دست آورده است، می‌توانند پیشنهاد‌ها یا توصیه‌هایی را به مشتریان (یا به صاحبان کسب و کار) ارائه دهند. برای مثالْ الگوریتم، از داده‌های موجود یاد می‌گیرد که زنانِ باردار معمولاً چه روند خریدی را دنبال می‌کنند و بعداً الگوریتم می‌تواند پیشنهاد‌های مناسب را به زنان باردار (با توجه به خرید‌هایی که دیگر زنانِ باردار کرده‌اند) انجام دهد. یا مثلا سیستم متوجه می‌شود که الان خانمی باردار است، پس احتمالا ۶ تا ۹ماه دیگر او یک نوزاد خواهد داشت و بایستی وسائلِ مربوط به نوزاد‌ها را تهیه کند. پس می‌توان به اون وسائل مربوط به نوزاد پیشنهاد کرد و به همین ترتیب مشتری را نگهداشت.

در حوزه‌ی اجتماعی هم کلان‌داده کاربرد وسیعی دارد. یکی از این کاربرد‌ها در تخصیص نیروی پلیس در طول مدت شبانه روز در یک شهر بر اساس پیش‌بینیِ وقوع جرم است. به این گونه که با داده‌هایی که از جرائم گذشته به دست آمده است (و همچنین داده‌های دیگر) می‌توان به این پیش‌بینی که رسید که به احتمالِ تقریبی مشخص، ممکن است در فلان ناحیه جرمی رخ دهد. برای همین می‌توان نیروی پلیس را زود‌تر در آن محل یا نزدیکی مستقر کرد یا نوعی حرکت پیشگیرانه انجام شود.

به طور کل، کلان‌داده یا همان Big Data تقریباً در تمامیِ زمینه‌ها (و هر کجا که داده بتواند تولید شود) می‌تواند نقش آفرینی و ایجادِ ارزش افزوده کند. می‌توانید به عنوان تمرین، در هر رشته‌ای که هستید کمی فکر کنید و ببینید با داده‌های موجود در زمینه‌ی کاری شما چه ارزش افزوده‌هایی را می‌توان ایجاد کرد.

منابع این بحث و اطلاعات بیشتر

» مجله هاروارد

در صورت تمایل به یادگیری بیشتر، منابع بالا در نظر گرفته شده است. می توانید با خواندن این منابع، به یادگیری خود در این زمینه عمق ببخشید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *