در دادهکاوی و آمار دادهها به صورتها مختلف تقسیم بندی میشوند. متخصصان علم داده با توجه به کاربرد و کارکرد دادهها، آنها را به دستههای مختلفی تقسیم بندی کردهاند که هر دسته ویژگیهای خاص خود را دارد.
در کل دادهها در علم آمار و دادهکاوی به دو دسته عددی (Numeric) و غیرعددی (Categorical) تقسیم بندی میشوند. هر کدام از آنها به دستههای مختلف تقسیم بندی میشوند. نگاهی به شکل زیر بیندازید:
دادههای عددی خود به دو دسته پیوسته (Continuous) و گسسته (Discrete) تقسیم بندی میشوند. دادههای پیوسته مانند درجهی دمای هوا یا سطح آب دریا. مثلا درجه دمای هوا ۲۵.۶درجه است و میتواند ۲۵.۶۷درجه هم باشد. ولی دادههای گسسته مانند تعداد گلهای یک بازی فوتبال که میتواند ۱ یا ۲ یا هر چند تا باشد.
دادههای غیر عددی مانند یک نوع خاص از لپ تاپ (مثلا Asuss یا Dell یا Sony) که میتواند یک سری مقدار مشخص بگیرد. دادههای غیر عددی نیز خود میتوانند انواع مختلفی داشته باشند. یکی از انواع دادههای غیر عددی را میتوان دادههای دودویی (Binary) دانست که فقط میتوانند دو مقدار داشته باشند. برای مثال یک فرد وام گرفته است یا خیر. مثال دیگری از دادههای دودویی را میتوان در مسئله تشخیص تقلب دانست که مثلا آیا یک فرد مورد نظر در یک تراکنش بانکی تخلف انجام داده است یا خیر. یک نوع داده غیر عددی دیگر نیز وجود دارد و آن دادههای ترتیبی (Ordinal) هستند. دادههایی که ترتیب مشخص دارند یک به طور مشخص یکی بیشتر از دیگری است. برای مثال تیمهای شرکت کننده در لیگ فوتبال که ترتیب مشخص دارد. توجه کنید که نوع داده ترتیبی یا همان Ordinal نوعی دادهی غیر عددی است و میتوان با آن به صورت غیر عددی رفتار کرد.
- ۱ » تحلیل اکتشافی دادهها (Exploratory Data Analysis) چیست؟
- ۲ » انواع مختلف دادهها در دادهکاوی کدامند؟
- ۳ » منظور از دادههای مستطیلی (Rectangular Data) چیست؟
- ۴ » داده پرت (Outlier) در دادهکاوی چیست؟
- ۵ » تخمین مکان دادهها (Estimation Of Location) چیست و انواع مختلف آن کدامند؟
- ۶ » تخمین تنوع و پراکندگی (Estimation Of Variability) و انواع مختلف آن
- ۷ » چارک (Quartile) و IQR در دادهها و کاربردهای آن
- ۸ » چولگی (Skewness) در دادهها
- ۹ » کشیدگی یا برجستگی (kurtosis) در دادهها
- ۱۰ » چگونه با EDA در دادهها اکتشاف کنیم؟
- ۱۱ » نمونهگیری آماری و محاسبهی حداقل تعداد نمونه (Min Sample Size)
- ۱۲ » توزیعهای آماری (Statistical Distributions)
- ۱۳ » فاصلهی آماری (Statistical Distance) و کاربردهای آن
- ۱۴ » واگرایی کولبک-لیبلر (Kullback-Leibler Divergence) و کاربرد آن در فاصلهی آماری
- ۱۵ » فاصلهی جنسون-شنون (Jenson-Shannon) برای مقایسهی توزیعهای آماری
سلام من یسوال داشتم. من پرسشنامه دارم با ۵ طیف لیکرد . از ۱ تا ۵. میخواستم داده کاوی انجام بدم اما نمیدونم از چه روشی باید استفاده کنم؟ درخت تصمیم یا …؟ و اینکه داده های من گسسته محسوب میشه درسته؟
سلام
یک روش عرف این است که الگوریتمهای مختلف را تست کنید و الگوریتمی که بهترین نتیجه را بر روی دادههای تست برگرداند، انتخاب شود
ممنونم از پاسختون
سلام از جمله روش های داده کاوی که برای تحلیل پرسشنامه می توان استفاده کرد را نام ببرید؟ آیا اصلا امکان استفاده از روش های داده کاوی برای این کار هست لطفا راهنمایی بفرمایید
سوال
اگر دیتا های جمع اوری شده غیر پیوسته مربوط چند دسته می شود
سلام مثالی از داده های عادی در دسته ی داده های غیرعددی می زنید؟