بررسی یکپارچگی داده‌ها (Data Integrity)

فرض کنید در یک فروشگاهِ زنجیره‌ای کار می‌کنید و مسئولیتِ جمع‌آوری داده‌ها به شما مُحوّل شده است. برای سادگی فرض کنید جداولِ زیر را برای پایگاه‌داده‌ی خود دارید:

ادامه خواندن “بررسی یکپارچگی داده‌ها (Data Integrity)”

پیش پردازش داده‌ها (Data Preprocessing) چیست؟

فرض کنید صاحبِ یک نانوایی هستید. برای تهیه‌ی نان، نیاز به آرد دارید. آرد نیز خود از گندم به دست می‌آید. یعنی گندم بایستی از شکلِ اولیه‌ی خود خارج شده و به آرد تبدیل شود (با فرآیند‌های مختلفی که بر روی گندم انجام می‌شود) تا ماده‌ی اولیه‌ی تولیدِ نان، آماده شود. در فرآیند‌های داده‌کاوی مانند طبقه‌بندی و خوشه‌بندی، نیاز داریم تا داده‌ها برای الگوریتمْ آماده شوند. زیرا معمولاً نمی‌توان داده‌ها را به صورت خامْ به الگوریتم‌های داده‌کاوی و یادگیری ماشین تزریق کرد.

ادامه خواندن “پیش پردازش داده‌ها (Data Preprocessing) چیست؟”

پرسش و پاسخ: پایان‌نامه پیش‌بینی آب و هوا به وسیله داده‌کاوی

توسط:محمد (۰۲…۰۹۱۱)
پرسش:
سلام
من میخوام برای انجام پایان نامه روی موضوع مدلسازی وضعیت آب و هوا با استفاده ار هوش مصنوعی جهت بهینه سازی پیک مصرفی برق کار کنم
ایا امکانش هست بفرمایید چه مباحثی رو ابتدا مطالعه کنم و بعد پایان ناممو انجام بدم؟
چون کار چندان اسونی هم نیست
ممنون میشم راهنمایی بفرمایید
ادامه خواندن “پرسش و پاسخ: پایان‌نامه پیش‌بینی آب و هوا به وسیله داده‌کاوی”

پرسش و پاسخ: داده‌کاوی رشته مدیریت IT و مقاله ISI

توسط: شهناز (shsa…@gmail.com)
پرسش:
باسلام ، من دانشجوی کارشناسی ارشد مدیریت It هستم . علاقمند هستم که موضوع پایان نامه من درزمینه یادگیری ماشین باشد .بدنبال موضوع جالبی هستم که بتوانم در نهایت از آن یک مقاله isi نهیه کنم .میخواستم در این زمینه ازتون راهنمایی بگیرم .
ادامه خواندن “پرسش و پاسخ: داده‌کاوی رشته مدیریت IT و مقاله ISI”

پرسش و پاسخ: طراحی مدل با تعداد اندک داده‌های برچسب دار

توسط: مسعود (۰۵…۰۹۱۳)
پرسش:
با سلام
یک پروژه تحقیقاتی دارم . می خواستم ببینم امکان همکاری در بحث آموزش و راهنمایی در باب حل مسئله بین ما وجود دارد؟
پروژه : یک دیتا ست باینری با ابعاد ۱۲۰۰۰*۲۰۰۰۰ وجود دارد که نیاز به کلاسیفیکیشن دارد.
از ۲۰ هزار نمونه موجود فقط ۳۰۰ نمونه برچسب + دارند و اطلاعاتی را جع به بقیه نمونه ها وجود ندارد (در واقع صورت مسئله Positive Unlabled است) و نمونه – نداریم.
آیا امکان طراحی کلاسیفایر از نوع بیز برای این مسئله وجود دارد؟
آیا شما می توانید به من در حل این مسئله کمک کنید؟
منتظر پاسخ شما هستم.
با تشکر

ادامه خواندن “پرسش و پاسخ: طراحی مدل با تعداد اندک داده‌های برچسب دار”

دریاچه داده (Data Lake) چیست؟

یک دریاچه را در نظر بگیرید که رودخانه‌های مختلف به آن وارد می‌شوند. در واقع هر رودخانه مقداری آب در این دریاچه خواهد ریخت و آب‌های موجود در این دریاچه حاصل مجموعه این رودها است. دریاچه داده یا همان Data Lake نیز به همین صورت است. یک مخزن عظیم که داده‌های مختلف از طُرق متفاوت وارد این دریاچه می‌شوند و در آن ذخیره می‌گردند.

ادامه خواندن “دریاچه داده (Data Lake) چیست؟”

بازار داده (Data Mart) چیست و چه تفاوتی با انبار داده (Data Warehouse) دارد؟

تفاوت انبار و بازار در چیست؟ انبار یک محل بزرگ است که معمولا اجناس متفاوت با کاربردهای مختلف در آن جمع می‌شوند. معمولا کسی از انبار خرید نمی‌کند. در واقع انبار محل جمع‌آوری اجناس است. اگر شما بخواهید یک آب معدنی بخرید، طبیعتا به انبار آب معدنی رجوع نمی‌کنید و به سراغ بازار (همان سوپر مارکت‌ها) رفته و از آن‌جا خرید خود را انجام می‌دهید. انبار داده (Data Warehouse) و بازار داده (Data Mart) نیز این چنین تفاوتی نسبت به یکدیگر دارند. در دروس گذشته این دوره بیشتر تمرکز بر انبار داده بود و در این درس قصد داریم بازار داده یا همان Data Mart را با یکدیگر یاد بگیریم.

ادامه خواندن “بازار داده (Data Mart) چیست و چه تفاوتی با انبار داده (Data Warehouse) دارد؟”

طراحی انبار داده با شِمای چند بُعدی (Multidimensional Schema)

تا به اینجا در دوره انبار داده (Data Warehouse) با مقدمات و مفاهیم اولیه انبار داده و فرآیندهای هوش تجاری آشنا شدید. در درس جاری قصد داریم تا بفهمیم چگونه می‌توان یک انبار داده طراحی و پیاده‌سازی کرد. برای طراحی انبار داده یکی از روش‌ها شِماهای چند بُعدی یا همان Multidimensional Schemes هستند که از حقایق (Facts) و ابعاد (Dimensions) برای طراحی و تحلیل‌های OLAP استفاده می‌کنند.

ادامه خواندن “طراحی انبار داده با شِمای چند بُعدی (Multidimensional Schema)”

ELT در انبار داده و تفاوت آن با ETL

در درس قبلی به بررسی ETL که مخفف سه کلمه استخراج (Extract)، تبدیل (Transformation) و بارگزاری (Load) بود پرداختیم. گفتیم که در فرآیند ETL داده‌ها از منابع مختلف جمع آوری شده و پس از تغییرات و تبدیلات مورد نیاز، در انبار داده بارگزاری می‌شوند. شکل زیر را از درس قبل به خاطر دارید:

ادامه خواندن “ELT در انبار داده و تفاوت آن با ETL”

فرآیند ETL در انبار داده (Extract, Transformation, Load)

تا به این‌جا به صورت خلاصه در دوره انبارداده (Data Warehouse) به این نتیجه رسیدیم که بایستی برای تحلیل و داده‌کاوی بر روی داده‌های زیاد، داده‌ها را در یک مکان به اسم انبار داده یا همان Data Warehouse ذخیره و انبار می‌کنیم تا بتوانیم داده‌ها را برای عملیات هوش‌تجاری (Business Intelligence) آماده کنیم. اما این فرآیند (تبدیل داده‌ها از منابع مختلف سازمان، به انبارداده) به همین سادگی نیست و مسیر پر پیچ و خمی دارد. به همین دلیل مفهومی به نام ETL به وجود آمده است که فرآیند این انتقال را برای ما سازمان می‌دهد.

ادامه خواندن “فرآیند ETL در انبار داده (Extract, Transformation, Load)”