021-71053903 [email protected] پشتیبانی از شنبه تا چهارشنبه ساعت 9 الی 16

الگوریتم k-means

الگوریتم k-means یک الگوریتم یادگیری بدون نظارت است که داده های بدون برچسب را بر اساس ویژگی هایی مشترکی که دارند دسته بندی می کند. این خوشه بندی به شکلی است که داده هایی که شبیه به هم هستند در یک خوشه قرار می گیرند.

یادگیری نظارت نشده به روشی از یادگیری ماشین گفته می شود، که داده ای برای آموزش ارائه نمی کند. در این روش الگوریتم استفاده شده برای یادگیری، ویژگی هایی را استخرج می کند. براساس ویژگی های استخراج شده خوشه بندی را انجام میدهد.

به طور خلاصه می توان گفت خوشه بندی، داده ها را در گروه های مشابه قرار می دهد. به این صورت که داده هایی که در یک گروه قرار می گیرند در واقع بیشترین شباهت را به یکدیگر دارند. شباهت داده ها معیاری برای نمایش شدت نزدیک بودن داده ها در یک خوشه است.

در الگوریتم k-means :
  • مرکز خوشه معنای ریاضی خوشه است.
  • هر نقطه به مرکز خوشه خود نزدیکتر از سایر مراکز است.
پیاده سازی الگوریتم k-means :

kmeans

  1. مقداردهی اولیه به k که تعداد خوشه ها برای n تعداد داده است. درواقع k همان داده ای است که به عنوان مرکز خوشه تعیین شده است.
  2. تعیین یک نقطه به عنوان مرکز خوشه.
  3. محاسبه فاصله منهتن برای به دست آوردن فاصله مرکز خوشه با تک تک داده ها
  4. قرار دادن داده ها با کمترین فاصله در یک خوشه
  5. تکرار مراحل دو تا چهار تا وقتی که خوشه ها دیگر تغییری نکنند.
k means
محاسبه فاصله منهتن:

|Manhattan Distance=|x1−x2|+|y1−y2

در فرمول بالا در فضای دو بعدی فاصله بین دو نقطه (داده) که (x1,y1) و (x2,y2) محاسبه شده است. که هدف ما یافتن کمترین فاصله بین هر نقطه با مرکز خوشه است. نقطه اول مرکز خوشه و نقطه دوم داده ایست که می خواهیم در یکی از خوشه ها قرار دهیم.

مثال :

فرض کنید می خواهیم بیماران یک بیمارستان را خوشه بندی کنیم. این خوشه بندی بر اساس ویژگی هایی مثل فشار خون، کلسترول، سن و نبض انجام می شود. این یک نمونه از کاربردهای الگوریتم k-means است.

مزایا الگوریتم k-means:

سریع تر و کارآمدتر از سایر الگوریتم ها برای داده های بزرگ است.

ساده بودن الگوریتم برای پیاده سازی

به خوشه ها با اندازه و شکل های مختلف تعمیم میابد.

معایب الگوریتم k-means:

حساس به انتخاب مرکز خوشه یعنی نقطه k

وابسته بودن به مقادیر اولیه

کاربردهای الگوریتم k-means:

ستاره شناسی

پردازش تصویر

موتورهای جستجو

تقسیم بندی بازار

پروفایل مشتری

مطالعه بیشتر

maryam keshvari

31 مطلب منتشر شده

کارشناسی ارشد فناوری اطلاعات علاقمند به زبان برنامه نویسی python و هوش مصنوعی

درباره این مطلب نظر دهید !

مطالب پرمخاطب پایتونی ها

Regression

Regression

2
دقیـقه مطالعه
ادامه ...
KNN

KNN یاk-nearest neighbor

2
دقیـقه مطالعه
ادامه ...

محصولات فروش پایتونی ها

%60
تخفیف

آموزش فیگما (Figma)

30,000 تومان
3
%69
تخفیف

آموزش برنامه نویسی پایتون

35,000 تومان
2