فرهنگستان زبان و ادب
{data clustering} [رایانه و فنّاوری اطلاعات] دسته بندی مجموعه ای از داده ها براساس روابط آنها
{data clustering} [رایانه و فنّاوری اطلاعات] دسته بندی مجموعه ای از داده ها براساس روابط آنها
💡 میتوان استفاده های دیگری نیز کرد، برای اینکه ببینیم داده هایمان در خوشه بندی چقدر نزدیک هستند یا برای اینکه ببینیم مدلمان چقدر خوشه بندی را به درستی انجام داده و برای انتخاب بهترین تعداد خوشه ها.
💡 تجمع خانواده همچنین شناخته شده به عنوان تجمع خانوادگی است که خوشه بندی برخی از صفات ورفتارها یا اختلالات در درون یک خانواده است. تجمع خانواده ممکن است به دلیل تشابهات ژنتیکی یا محیطی به وجود میآیند
💡 در مطالعه شبکههای اجتماعی، خوشه بندی ممکن است برای تشخیص ارتباط جوامع در گروههای بزرگ مردم استفاده شود.
💡 تعداد خوشهها معیار و ملاک خوشه بندی و اینکه کدام خوشه بندی مطلوب تر است بسته به الگوریتم و هدف ما است.
💡 شاخص رند اینکه خوشهها (که توسط الگوریتم خوشه بندی بازمیگردند) به معیار طبقهبندیها چقدر شبیهاند را محاسبه میکند. همچنین میتوانید شاخص رند را به عنوان اندازهگیری درصد تصمیمات درست که توسط الگوریتم ساخته شدهاست را استفاده کرد. که میتوان با استفاده از فرمول زیر محاسبه کرد:
💡 بیش از دوازده اندازهگیری ارزیابی داخلی وجود دارد. به عنوان مثال، برای ارزیابی کیفیت خوشه بندی میتوان از روشهای زیر استفاده کرد.