{data analysis} [آمار، رایانه و فنّاوری اطلاعات، رمزشناسی] [آمار] فرایندی با هدف استخراج اطلاعات مفید که معمولاً مشتمل است بر پالایش و انتقال و مدل بندی داده ها [رمزشناسی، رایانه و فنّاوری اطلاعات] فرایند به کار بستن سامانمند روش ها و فنون آماری و منطقی برای توصیف...
دانشنامه عمومی
تحلیل داده ( به انگلیسی: Data analysis ) فرایند فهمیدن، پاک سازی، آماده سازی و تحلیل داده هاست که به منظور استخراج اطلاعات سودمند برای تصمیم گیری انجام می شود. تحلیل داده ها امروزه در اغلب شاخه های علوم و صنعت از جمله اقتصاد، رشته های مهندسی، بازاریابی، پزشکی و غیره کاربرد دارد. و یا منظور از تحلیل داده به فرایند ارزیابی داده با استفاده از ابزارهای آماری و تحلیلی است. هدف از این مهارت تعیین اطلاعات مفید و همچنین کمک به فرایند گرفتن تصمیمات مهم در کسب وکار است. داده کاوی، روش خاصی برای تحلیل داده است که بر مدل سازی و کشف دانش برای اهداف قابل پیش بینی و نه صرفاً توصیفی متمرکز است؛ در حالی که هوش کسب وکار را پوشش می دهد که به طور عمده بر تجمع اطلاعات کسب وکار متکی است. در کاربردهای آماری، تجزیه وتحلیل داده ها را می توان به آمار توصیفی، تجزیه وتحلیل داده های اکتشافی ( EDA ) و تجزیه وتحلیل داده های تأییدی ( CDA ) تقسیم کرد. EDA بر کشف ویژگی های جدید در داده ها و CDA بر تأیید یا تکذیب فرضیه های موجود تمرکز دارد. علم تجزیه وتحلیل بر کاربرد مدل های آماری برای پیش بینی یا طبقه بندی تمرکز دارد، در حالی که تجزیه وتحلیل متن روش های آماری، زبانی و ساختاری را برای استخراج و طبقه بندی اطلاعات از منابع متنی به کار می بندد. تمام این ها، انواع تحلیل داده به شمار می آیند. یکپارچه سازی داده ها پیش زمینه ای برای تحلیل داده ها است و تحلیل داده با مصورسازی داده و انتشار داده رابطۀ نزدیکی دارد. واژه تحلیل داده گاهی به عنوان مترادف برای مدل سازی داده استفاده می شود. تجزیه وتحلیل به معنای شکستن کل به اجزاء جداگانه است. تحلیل داده روند به دست آوردن دادهٔ جدید و تبدیل آن به اطلاعاتی مفید در جهت تصمیم گیری کاربران است. داده جمع آوری و تحلیل می شود تا پاسخگوی سوالات، آزمایش فرضیه ها یا تکذیب نظریه ها باشد. آمارگر جان توکی در سال ۱۹۶۱ تحلیل داده ها را به صورت زیر تعریف کرد: «روش هایی برای تجزیه وتحلیل داده ها، تکنیک هایی برای تفسیر کردن نتایج حاصل از چنین روش هایی، روش های برنامه ریزی جمع آوری داده ها برای آسان تر ساختن تجزیه وتحلیل دقیق تر و صحیح تر و تمام ماشین آلات و نتایج حاصل از آمار که برای تحلیل کردن داده ها به کار بسته می شود. » چندین مرحله قابل تشخیص وجود دارد که در زیر توضیح داده می شود.
جمله سازی با تحلیل دادهها
جملات نمونه از منابع مختلف جمع آوری شده است، اگر صحیح نیست یا توهین آمیز است، لطفا گزارش دهید.
💡 این دو نیاز مبحث جدیدی را در این حوزه مطرح کردند. کلانداده. فناوری مورد استفاده در کلانداده در وهله اول امکان ذخیرهسازیِ بهینه حجم عظیمی از داده را فراهم کرد. ابزارهای تحلیلی خلق شده در مبحث کلانداده نیز امکان تحلیل دادهها و ارائه نتایج آنی را به وجود آورد.
💡 مطالعه توصیفی گذشته نگر شامل ۴۸ بیمار شامل ۴۳ مورد ژنیکوماستی و ۵ مورد آدیپوماستی (ژانویه ۲۰۱۴ تا دسامبر ۲۰۲۰) بود. تجزیه و تحلیل دادهها در نظر گرفته شده بود. معاینه کیف و بیضهها، جستجوی توده شکمی، بررسی تیروئید و علائم پوستی (جستجوی علائم کشش). معاینه پستان، پوست، غده زیرین را ارزیابی کرد و این امکان را فراهم کرد که بیماران را به ۴ نوع مورفولوژی طبقهبندی کرد:
💡 پروژهٔ اقیانوس اشیاء یک برنامه تحت رهبری دارپا است که برای ایجاد اینترنت اشیاء در مناطق بزرگ اقیانوسی به منظور جمعآوری، نظارت و تجزیه و تحلیل دادههای محیطی و فعالیت کشتیها طراحی شدهاست. این پروژه مستلزم استقرار حدود ۵۰۰۰۰ شناور است که مجموعه حسگرهای غیرفعال را در خود جای میدهد که بهطور مستقل کشتیهای نظامی و تجاری را به عنوان بخشی از یک شبکه مبتنی بر اینترنت شناسایی و ردیابی میکند.
💡 از اواسط قرن بیستم، تحقیقات بسیاری برای جستجوی نشانههای حیات فرازمینی انجام شدهاست که شامل جستجو برای حیات حاضر و منقرض شده، و جستجوی محدودتر برای حیات هوشمند میشود. بسته به نوع جستجو، روشها از تجزیه و تحلیل دادههای تلسکوپ تا رادیوهایی که برای تشخیص و انتقال ارتباطات استفاده میشوند، متفاوت است.
💡 یادگیری ماشینی کمک فراوانی به صرفه جویی در هزینههای عملیاتی و بهبود سرعت عمل تجزیه و تحلیل دادهها میکند. به عنوان مثال در صنعت نفت و پتروشیمی با استفاده از یادگیری ماشین، دادههای عملیاتی تمام حفاریها اندازهگیری شده و با تجزیه و تحلیل دادهها، الگوریتمهایی تنظیم میشود که در حفاریهای بعدی استخراج پُربازده و بهینهتری داشته باشیم.