شاید کمتر محلی را بتوان پیدا کرد که دادههای زیادی در آنجا باشد و سر و کله یکی از ابزارهای SQL آنجا نباشد. انواع مختلفِ SQL و پیادهسازیهای آن مانند SQL Server، MySQL، PostgreSQL و… در بازار به صورتِ تجاری و رایگان موجود میباشند و تواناییِ ذخیرهسازی و واکشی سریع دادهها را دارند.
در مورد پایگاه دادههای رابطهای و SQL طبیعتاً باید یک یا چند دورهی جداگانه برگزار کنیم ولی در این درس به صورت خلاصه، کاربردِ پایگاه دادههای مبتنی بر SQL را در تحلیلدادهها و کلاندادهها مرور میکنیم.
بسیاری از دادههای موجود در صنعت (که برای پردازش به آنها نیاز است) در پایگاهدادههای رابطهای مبتنی بر SQL ذخیره شدهاند. برای مثال بانکها، بیمهها، بورس و… دادههای خود را به صورت مستطیلی (Rectangular) در پایگاهدادههایی مانند SQL Server ذخیره میکنند (درس دادههای مستطیلی را بخوانید) و با اتصال نرمافزارهای خود به آنها تراکنشهای مختلف خود را انجام داده و دادهها را در آن ذخیره میکنند. دادههایی که در این پایگاهدادهها ذخیره میشوند، قابلیتِ بازیابی سریع دارند و میتوان از آنها نسخه پشتیبان تهیه کرد.
در کل یک متخصصِ علمداده یا همان Data Scientist که بتواند دادههای عظیم را تحلیل کند، نیاز دارد که بتواند بتواند دادهها را به فرمِ مورد نیازِ خود تبدیل کند و بر روی آن پردازش انجام دهد. این کار نیازمندِ کار با ابزارهایی است که دادهها بر روی آنها ذخیره شده و چون SQL از معروفترین این دستهها است، پس یک متخصصِ علمِداده میبایستی بتواند پرس و جو (Query)های مختلف SQL را بلد باشد و بر روی دادهها این پرس و جوها را اعمال کند.
منابع متفاوت و متنوعی برای یادگیری SQL وجود دارد. در اینجا، اینجا و اینجا میتوانید مبانیِ پایگاهدادههای رابطهای و نحوهی ایجاد پرسوجو (Query) را بر روی دادهها فرا بگیرید. بسیاری از شرکتها که نیاز به تحلیلگرانِ داده دارند، آشنایی و تجربهی کاری را با ابزارهای SQL را جزو پیشنیازهای ورود به این ردیف شغلی میدانند.
- ۱ » مقدمهای درباره مهداده یا همان کلان داده (Big Data)
- ۲ » کاربرد کلانداده (Big Data) در پزشکی و بیماری
- ۳ » چرا باید کلانداده (Big Data) را جدی بگیریم؟
- ۴ » ابزار صفحه گسترده و اکسل (Excel) در پردازش دادهها
- ۵ » داشبورد مدیریتی Tableau ابزاری برای تحلیل دادهها
- ۶ » کاربرد SQL در تحلیل داده و کلانداده
- ۷ » زبان Python و کاربرد آن در تحلیل داده و کلانداده
- ۸ » کاربرد زبان R در تحلیل داده و کلانداده