خوشه بندی داده ها

فرهنگستان زبان و ادب

{data clustering} [رایانه و فنّاوری اطلاعات] دسته بندی مجموعه ای از داده ها براساس روابط آنها

جمله سازی با خوشه بندی داده ها

💡 میتوان استفاده های دیگری نیز کرد، برای اینکه ببینیم داده هایمان در خوشه بندی چقدر نزدیک هستند یا برای اینکه ببینیم مدلمان چقدر خوشه بندی را به درستی انجام داده و برای انتخاب بهترین تعداد خوشه ها.

💡 تجمع خانواده همچنین شناخته شده به عنوان تجمع خانوادگی است که خوشه بندی برخی از صفات ورفتارها یا اختلالات در درون یک خانواده است. تجمع خانواده ممکن است به دلیل تشابهات ژنتیکی یا محیطی به وجود می‌آیند

💡 در مطالعه شبکه‌های اجتماعی، خوشه بندی ممکن است برای تشخیص ارتباط جوامع در گروه‌های بزرگ مردم استفاده شود.

💡 تعداد خوشه‌ها معیار و ملاک خوشه بندی و اینکه کدام خوشه بندی مطلوب تر است بسته به الگوریتم و هدف ما است.

💡 شاخص رند اینکه خوشه‌ها (که توسط الگوریتم خوشه بندی بازمی‌گردند) به معیار طبقه‌بندی‌ها چقدر شبیه‌اند را محاسبه می‌کند. همچنین می‌توانید شاخص رند را به عنوان اندازه‌گیری درصد تصمیمات درست که توسط الگوریتم ساخته شده‌است را استفاده کرد. که می‌توان با استفاده از فرمول زیر محاسبه کرد:

💡 بیش از دوازده اندازه‌گیری ارزیابی داخلی وجود دارد. به عنوان مثال، برای ارزیابی کیفیت خوشه بندی می‌توان از روش‌های زیر استفاده کرد.