کاربرد زبان R در تحلیل داده و کلان‌داده

مدرس: مسعود کاویانی

نمی‌توان از داده و کلان‌داده (Big Data) سخن گفت ولی اسمی از زبان R نیاورد. این زبان که محبوبِ متخصصان آمار است به دلیلِ سادگی و دارا بودنِ پکیج‌های مختلفِ آماری و داده‌ای کاربردِ فراوانی در بین متخصصینِ علوم‌داده پیدا کرده است. زبانِ R هم مانند پایتون جز پرکاربردترین زبان‌ها در حوزه تحلیل داده، یادگیری‌ماشین و همچنین یادگیری‌عمیق است. این زبان قابلیت اتصال به پایگاه داده‌های مختلف را داشته و ابزارهای قدرتمندی نیز جهت مصورسازی (Visualization) داده‌ها دارد.

اگر بخواهیم برای یک پروژه واقعی در دنیای صنعت شروع کنیم، قطعاً یکی از گزینه‌های مورد استفاده زبانِ R است. به جای اینکه الگوریتم‌ها و روش‌های مختلفِ داده‌کاوی را یکی‌یکی پیاده‌سازی کنیم، با استفاده از زبان R و پکیج‌های مختلفِ آن، می‌توانیم به راحتی از نسخه پیاده‌سازی شده و قدرتمند این الگوریتم‌ها استفاده کنیم. زبان R و محیط R Studio در کنار یکدیگر یک سیستمِ کامل به نظر می‌رسند که نیاز به نصبِ وابستگی‌ها (Dependencies) را از میان می‌برند. این زبان برای کسانی که نمی‌خواهند درگیرِ فرآیندِ نصبِ وابستگی‌ها و نسخه‌های مختلفِ پکیج‌ها شوند عالی به نظر می‌رسد.

در مورد زبان R و یادگیری آن نقشه‌ی راهی تنظیم کرده‌ایم که می‌تواند برای علاقه‌مندان به این رشته‌ی کاربردی باشد. می‌توانید این نقشه‌ی راه را از این‌جا دانلود کنید. درس زبان R را زیاد بسط نمی‌دهیم و فقط به خاطر این‌که سرفصل‌ها کامل‌تر باشد اینجا آورده‌ایم. کتابچه نقشه راه یادگیری داده‌کاوی با زبان R، می‌تواند نقطه شروع خوب و مناسبی برای دانشجویان باشد.

 

منابع این بحث و اطلاعات بیشتر

» وب‌سایت دانشگاه Stanford

در صورت تمایل به یادگیری بیشتر، منابع بالا در نظر گرفته شده است. می توانید با خواندن این منابع، به یادگیری خود در این زمینه عمق ببخشید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *