در دو درسِ قبلیِ این دوره مقدماتی را در مورد کلانداده گفتیم و یک مثالِ کاربردی در حوزهی پزشکی را هم با هم مرور کردیم. اما بیایید ببینیم چرا کلانداده یا همان Big Data جزو حوزههای بسیار پربحث در علوم جدید شده است که بسیاری از افراد و مهندسان در رشتههای گوناگون به سراغ آن رفتهاند. برای مثال دورهای که دانشگاه هاروارد در حوزه علومداده برگزار کرد، نزدیک به ۴۰۰دانشجو از رشتههای مختلفِ مهندسی، تجارت، پزشکی و حتی طراحی را به خود جذب کرد.
امروزه دادهها به صورت فراوان در حال تولید هستند. همین که شما یک تراکنش با کارت بانکی انجام میدهید یا یک تماس تلفنی از طریقِ موبایل خود میگیرید، داده تولید میکنید. در واقع طبقِ گفته آقای Gray King یک انقلاب در کلانداده رخ داده است. اما این بدین معنا نیست که فقط دادههای زیادی در حال تولید و جمعآوری هستند، بلکه به این معنی است که میتوان این دادهها را پردازش کرد و اطلاعات و ارزشهای مختلفی را از بین این دادهها استخراج نمود.
در واقع یکی از دلایلِ این انقلاب را میتوان در رشد الگوریتمهای کامپیوتری و روشهای پردازشی دانست. شاید فکر کنید که ظرفیت پردازش دادهها و ظرفیت نگهداری آنها زیاد شده است. ولی این در مقابلِ رشد الگوریتمها و روشهای پردازش شاید کمتر باعث این انقلاب شده باشد. در واقع طبق تحقیقاتی که آقای King و دانشجویان او انجام دادند، مسئلهای که نیاز به یک کامپیوتر ۲میلیون دلاری برای حل داشت، با یک الگوریتم خوب توانست در مدت ۲۰دقیقه بر روی یک لپ تاپ پردازش و حل شود. در واقع این قدرت الگوریتمها و روشهای پردازشی را برای ما اثبات میکند و این خود یک انقلاب در حوزه داده است.
در دانشگاهِ هاروارد مرکزی به نام IQSS دایر است که در واقع محلی برای انجامِ پروژههای بین رشتهای برای حل مشکلات جوامع میباشد. مثلا پروژهای که در آن هم باید مهندسان مکانیک حضور داشته باشند و هم مهندسانِ علمداده میتوانند در این مرکز به انجام پروژه و حل مسئله کمک کنند. طبقِ صحبت آقای King، درصد بالایی از دانشکدهها و گروههای حقوق، جامعهشناسی، اقتصاد و پزشکی از آنالیز دادهها برای حل مسئلههایشان استفاده میکردند. این نشان میدهد که پردازشِ دادههای زیاد و کلاندادهها به سرعت در تمامی رشتهها نفوذ کرده است به طوری که به سختی میتوان رشتهای را یافت که علوم داده و آنالیز دادهها به آن کمکی نکنند.
اجازه بدهید چند مثال ساده را با هم مرور کنیم:
یکی از کاربردهای کلانداده در حوزه بازاریابی (Marketing) را میتوان سیستمهای پیشنهاد دهنده (یا سیستمهای توصیه گر) یا همان Recommended Systems دانست. در مورد این سیستمها در درسِ سیستمهای توصیهگر صحبتهایی کردیم. این سیستمها با توجه به روندهای مختلف و الگوهایی که از مشتریانِ قبلی به دست آورده است، میتوانند پیشنهادها یا توصیههایی را به مشتریان (یا به صاحبان کسب و کار) ارائه دهند. برای مثالْ الگوریتم، از دادههای موجود یاد میگیرد که زنانِ باردار معمولاً چه روند خریدی را دنبال میکنند و بعداً الگوریتم میتواند پیشنهادهای مناسب را به زنان باردار (با توجه به خریدهایی که دیگر زنانِ باردار کردهاند) انجام دهد. یا مثلا سیستم متوجه میشود که الان خانمی باردار است، پس احتمالا ۶ تا ۹ماه دیگر او یک نوزاد خواهد داشت و بایستی وسائلِ مربوط به نوزادها را تهیه کند. پس میتوان به اون وسائل مربوط به نوزاد پیشنهاد کرد و به همین ترتیب مشتری را نگهداشت.
در حوزهی اجتماعی هم کلانداده کاربرد وسیعی دارد. یکی از این کاربردها در تخصیص نیروی پلیس در طول مدت شبانه روز در یک شهر بر اساس پیشبینیِ وقوع جرم است. به این گونه که با دادههایی که از جرائم گذشته به دست آمده است (و همچنین دادههای دیگر) میتوان به این پیشبینی که رسید که به احتمالِ تقریبی مشخص، ممکن است در فلان ناحیه جرمی رخ دهد. برای همین میتوان نیروی پلیس را زودتر در آن محل یا نزدیکی مستقر کرد یا نوعی حرکت پیشگیرانه انجام شود.
به طور کل، کلانداده یا همان Big Data تقریباً در تمامیِ زمینهها (و هر کجا که داده بتواند تولید شود) میتواند نقش آفرینی و ایجادِ ارزش افزوده کند. میتوانید به عنوان تمرین، در هر رشتهای که هستید کمی فکر کنید و ببینید با دادههای موجود در زمینهی کاری شما چه ارزش افزودههایی را میتوان ایجاد کرد.
- ۱ » مقدمهای درباره مهداده یا همان کلان داده (Big Data)
- ۲ » کاربرد کلانداده (Big Data) در پزشکی و بیماری
- ۳ » چرا باید کلانداده (Big Data) را جدی بگیریم؟
- ۴ » ابزار صفحه گسترده و اکسل (Excel) در پردازش دادهها
- ۵ » داشبورد مدیریتی Tableau ابزاری برای تحلیل دادهها
- ۶ » کاربرد SQL در تحلیل داده و کلانداده
- ۷ » زبان Python و کاربرد آن در تحلیل داده و کلانداده
- ۸ » کاربرد زبان R در تحلیل داده و کلانداده