کاربرد SQL در تحلیل داده و کلان‌داده

مدرس: مسعود کاویانی

شاید کمتر محلی را بتوان پیدا کرد که داده‌های زیادی در آن‌جا باشد و سر و کله یکی از ابزارهای SQL آنجا نباشد. انواع مختلفِ SQL و پیاده‌سازی‌های آن مانند SQL Server، MySQL، PostgreSQL و… در بازار به صورتِ تجاری و رایگان موجود می‌باشند و تواناییِ ذخیره‌سازی و واکشی سریع داده‌ها را دارند.

در مورد پایگاه داده‌های رابطه‌ای و SQL طبیعتاً باید یک یا چند دوره‌ی جداگانه برگزار کنیم ولی در این درس به صورت خلاصه، کاربردِ پایگاه داده‌های مبتنی بر SQL را در تحلیل‌داده‌ها و کلان‌داده‌ها مرور می‌کنیم.

بسیاری از داده‌های موجود در صنعت (که برای پردازش به آن‌ها نیاز است) در پایگاه‌داده‌های رابطه‌ای مبتنی بر SQL ذخیره شده‌اند. برای مثال بانک‌ها، بیمه‌ها، بورس و… داده‌های خود را به صورت مستطیلی (Rectangular) در پایگاه‌داده‌هایی مانند SQL Server ذخیره می‌کنند (درس داده‌های مستطیلی را بخوانید) و با اتصال نرم‌افزارهای خود به آن‌ها تراکنش‌های مختلف خود را انجام داده و داده‌ها را در آن ذخیره می‌کنند. داده‌هایی که در این پایگاه‌داده‌ها ذخیره می‌شوند، قابلیتِ بازیابی سریع دارند و می‌توان از آن‌ها نسخه پشتیبان تهیه کرد.

در کل یک متخصصِ علم‌داده یا همان Data Scientist که بتواند داده‌های عظیم را تحلیل کند، نیاز دارد که بتواند بتواند داده‌ها را به فرمِ مورد نیازِ خود تبدیل کند و بر روی آن پردازش انجام دهد. این کار نیازمندِ کار با ابزارهایی است که داده‌ها بر روی آن‌ها ذخیره شده و چون SQL از معروف‌ترین این دسته‌ها است، پس یک متخصصِ علم‌ِداده می‌بایستی بتواند پرس و جو (Query)های مختلف SQL را بلد باشد و بر روی داده‌ها این پرس و جو‌ها را اعمال کند.

منابع متفاوت و متنوعی برای یادگیری SQL وجود دارد. در این‌جا، این‌جا و این‌جا می‌توانید مبانیِ پایگاه‌داده‌های رابطه‌ای و نحوه‌ی ایجاد پرس‌و‌جو (Query) را بر روی داده‌ها فرا بگیرید. بسیاری از شرکت‌ها که نیاز به تحلیل‌گرانِ داده دارند، آشنایی و تجربه‌ی کاری را با ابزارهای SQL را جزو پیش‌نیازهای ورود به این ردیف شغلی می‌دانند.

 

منابع این بحث و اطلاعات بیشتر

» وب‌سایت دانشگاه Stanford

در صورت تمایل به یادگیری بیشتر، منابع بالا در نظر گرفته شده است. می توانید با خواندن این منابع، به یادگیری خود در این زمینه عمق ببخشید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *