ELT در انبار داده و تفاوت آن با ETL

مدرس: مسعود کاویانی

در درس قبلی به بررسی ETL که مخفف سه کلمه استخراج (Extract)، تبدیل (Transformation) و بارگزاری (Load) بود پرداختیم. گفتیم که در فرآیند ETL داده‌ها از منابع مختلف جمع آوری شده و پس از تغییرات و تبدیلات مورد نیاز، در انبار داده بارگزاری می‌شوند. شکل زیر را از درس قبل به خاطر دارید:

اما فرآیندی که با ترتیب استخراج، تبدیل و بارگزاری انجام شود ممکن است در مورد داده‌های بسیار زیاد و کلان به مشکل برخورد کند. همان‌طور که یادتان هست در فرآیند ETL یک محل استقرار قرار داشت که داده‌ها از منابع مختلف در آن‌جا بارگزاری می‌شد. در محل استقرار یا همان Staging Area بود که عملیات تبدیل (Transformation) انجام می‌گرفت و سپس داده‌ها برای انبار کردن، در انبار داده بارگزاری می‌شد.

در فرآیند ELT قسمت بارگزاری (Load) و تبدیل (Transformation) را جا به جا شده است. در واقع داده‌ها از منابع مختلف داده به انبار داده (Data Warehouse) بارگزاری می‌شوند و سپس در آن‌جا (اگر نیاز باشد) عملیات تبدیل (Transformation) بر روی آن‌ها انجام می‌شود. ELT زمانی استفاده می‌شود که حجم داده‌ها بسیار زیاد باشد. در واقع در ELT، محل استقرار حذف شده و داده‌ها مستقیماً از منابع داده به انبار داده منتقل می‌شوند.

داده‌هایی به صورت NoSQL ذخیره شده‌اند و حجم بالایی نیز دارند، معمولا از روش ELT استفاده می‌کنند. برای مثال در اکوسیستم Hadoop برای بارگزاری داده‌ها می‌توان از ELT استفاده نمود تا حجم زیادی از داده‌ها را از منابع مختلف به انبار داده بارگزاری کند و سپس اگر نیاز باشد، عملیات تبدیل و تغییرات را (در همان انبار داده) بر روی داده‌ها انجام دهد.

منابع این بحث و اطلاعات بیشتر

» فصل چهارم کتاب داده‌کاوی آقای هان و همکاران

» وب‌سایت Guru99

در صورت تمایل به یادگیری بیشتر، منابع بالا در نظر گرفته شده است. می توانید با خواندن این منابع، به یادگیری خود در این زمینه عمق ببخشید

یک دیدگاه دربارهٔ «ELT در انبار داده و تفاوت آن با ETL»

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *