در درس قبلی به بررسی ETL که مخفف سه کلمه استخراج (Extract)، تبدیل (Transformation) و بارگزاری (Load) بود پرداختیم. گفتیم که در فرآیند ETL دادهها از منابع مختلف جمع آوری شده و پس از تغییرات و تبدیلات مورد نیاز، در انبار داده بارگزاری میشوند. شکل زیر را از درس قبل به خاطر دارید:
اما فرآیندی که با ترتیب استخراج، تبدیل و بارگزاری انجام شود ممکن است در مورد دادههای بسیار زیاد و کلان به مشکل برخورد کند. همانطور که یادتان هست در فرآیند ETL یک محل استقرار قرار داشت که دادهها از منابع مختلف در آنجا بارگزاری میشد. در محل استقرار یا همان Staging Area بود که عملیات تبدیل (Transformation) انجام میگرفت و سپس دادهها برای انبار کردن، در انبار داده بارگزاری میشد.
در فرآیند ELT قسمت بارگزاری (Load) و تبدیل (Transformation) را جا به جا شده است. در واقع دادهها از منابع مختلف داده به انبار داده (Data Warehouse) بارگزاری میشوند و سپس در آنجا (اگر نیاز باشد) عملیات تبدیل (Transformation) بر روی آنها انجام میشود. ELT زمانی استفاده میشود که حجم دادهها بسیار زیاد باشد. در واقع در ELT، محل استقرار حذف شده و دادهها مستقیماً از منابع داده به انبار داده منتقل میشوند.
دادههایی به صورت NoSQL ذخیره شدهاند و حجم بالایی نیز دارند، معمولا از روش ELT استفاده میکنند. برای مثال در اکوسیستم Hadoop برای بارگزاری دادهها میتوان از ELT استفاده نمود تا حجم زیادی از دادهها را از منابع مختلف به انبار داده بارگزاری کند و سپس اگر نیاز باشد، عملیات تبدیل و تغییرات را (در همان انبار داده) بر روی دادهها انجام دهد.
- ۱ » هوش تجاری (Business Intelligence) چیست؟
- ۲ » انبار داده (Data Warehouse) چیست؟
- ۳ » مفهوم مکعب داده (Data Cube) در انباردادهها
- ۴ » پردازش تحلیلی برخط یا همان OLAP چیست؟
- ۵ » تفاوت OLAP و OLTP چیست؟
- ۶ » فرآیند ETL در انبار داده (Extract, Transformation, Load)
- ۷ » ELT در انبار داده و تفاوت آن با ETL
- ۸ » طراحی انبار داده با شِمای چند بُعدی (Multidimensional Schema)
- ۹ » بازار داده (Data Mart) چیست و چه تفاوتی با انبار داده (Data Warehouse) دارد؟
- ۱۰ » دریاچه داده (Data Lake) چیست؟
بسیار عالی برا امتحانم فقط اینا رو خوندم بهتر از استادم یاد دادید ، تشکر