تحلیل دادهها
دانشنامه عمومی
داده کاوی، روش خاصی برای تحلیل داده است که بر مدل سازی و کشف دانش برای اهداف قابل پیش بینی و نه صرفاً توصیفی متمرکز است؛ در حالی که هوش کسب وکار را پوشش می دهد که به طور عمده بر تجمع اطلاعات کسب وکار متکی است. در کاربردهای آماری، تجزیه وتحلیل داده ها را می توان به آمار توصیفی، تجزیه وتحلیل داده های اکتشافی ( EDA ) و تجزیه وتحلیل داده های تأییدی ( CDA ) تقسیم کرد. EDA بر کشف ویژگی های جدید در داده ها و CDA بر تأیید یا تکذیب فرضیه های موجود تمرکز دارد. علم تجزیه وتحلیل بر کاربرد مدل های آماری برای پیش بینی یا طبقه بندی تمرکز دارد، در حالی که تجزیه وتحلیل متن روش های آماری، زبانی و ساختاری را برای استخراج و طبقه بندی اطلاعات از منابع متنی به کار می بندد. تمام این ها، انواع تحلیل داده به شمار می آیند.
یکپارچه سازی داده ها پیش زمینه ای برای تحلیل داده ها است و تحلیل داده با مصورسازی داده و انتشار داده رابطۀ نزدیکی دارد. واژه تحلیل داده گاهی به عنوان مترادف برای مدل سازی داده استفاده می شود.
تجزیه وتحلیل به معنای شکستن کل به اجزاء جداگانه است. تحلیل داده روند به دست آوردن دادهٔ جدید و تبدیل آن به اطلاعاتی مفید در جهت تصمیم گیری کاربران است. داده جمع آوری و تحلیل می شود تا پاسخگوی سوالات، آزمایش فرضیه ها یا تکذیب نظریه ها باشد.
آمارگر جان توکی در سال ۱۹۶۱ تحلیل داده ها را به صورت زیر تعریف کرد: «روش هایی برای تجزیه وتحلیل داده ها، تکنیک هایی برای تفسیر کردن نتایج حاصل از چنین روش هایی، روش های برنامه ریزی جمع آوری داده ها برای آسان تر ساختن تجزیه وتحلیل دقیق تر و صحیح تر و تمام ماشین آلات و نتایج حاصل از آمار که برای تحلیل کردن داده ها به کار بسته می شود. »
چندین مرحله قابل تشخیص وجود دارد که در زیر توضیح داده می شود.