منوهای نصب در پنل مدیریت

  • ورود
  • هیچ محصولی در سبد خرید نیست.

KNN یاk-nearest neighbor

در یادگیری ماشین الگوریتم های متفاوتی وجود دارد. الگوریتم k-nearest neighbor از دسته الگوریتم های طبقه بندی در یادگیری نظارت شده است. الگوریتم را به طور خلاصه KNN می نامند. این الگوریتم داده های نزدیک به هم را در یک گروه دسته بندی می کند.

چه موقع از KNN استفاده می شود؟

این الگوریتم برای هر دو مورد دسته بندی و رگراسیون قابل استفاده می باشد اما بیشر برای دسته بندی مورد استفاده قرار می گیرد.

ویژگی های مهم برای انتخاب یک الگوریتم :
  • تفسیر ساده خروجی
  • زمان محاسبه
  • قدرت پیش بینی

برای محاسبه KNN مراحل زیر را انجام می دهیم:

  1. خواندن داده ها
  2. مقدار دهی k که برابر با تعداد همسایه های نزدیک به داده مورد نظر می باشد.
  3. برای دسته بندی باید برای تمام داده ها فاصله را از روش اقلیدسی، منهتن یا ماینکُوسکی محاسبه نمایید. (فاصله اقلیدسی محبوب ترین روش محاسبه است.)
    1. برچسب های مربوط به فاصله محاسبه شده را به صورت صعودی مرتب می کند.(برچسب با بیشترین تعداد مورد نظر است.)
  4. داده در گروه با کمترین فاصله و برچسب با بیشترین تعداد قرار می گیرد.
فرمول های مربوط به فاصله:
فاصله اقلیدسی:

فاصله اقلیدسی کوتاه ترین فاصله بین دو نقطه را بر اساس رابطه ی فیثاغورس محاسبه می کند.

فرض کنیدکه دو نقطه با مختصات (x,y) و (a,b) داریم طبق فرمول فاصله اقلیدسی:

فرموا فیثاغورس

نموذار فاصله اقلیدسی

مثلا اگر مختصات این نقاط(1-,2) و (2,2-) باشد محاسبات به صورت:

محاسبات اقلیدسی

برای مثال فرض کنید شخصی قصد خریدن یک لپ تاپ را دارد. برای انتخاب خود باید مواردی مثل برند، سخت افزار(حافظه، کارت گرافیک، پردازنده و…)، ویژگی های ظاهری(رنگ ،وزن، اندازه صفحه مانیتور و…)، بودجه را در نظر بگیرد. در انتخاب این شخص مهم ترین گزینه سطح انتظار کاربر از سیستم می باشد . در نهایت گزینه ای را انتخاب می کند که طبق بودجه و سطح انتظار او بیشترین شباهت را به سیستم دلخواهش دارد. برچسب در مدل KNN در واقع همین موارد ذکر شده بالا می باشد. بیشترین شباهت در واقع همان تعداد بیشتر برچسب ها است. این یک مثال ساده و ملموس از الگوریتم k-nearest neighbor می باشد.knn classifier

مزایای استفاده از KNN :
  • پیاده سازی راحت
  • نیازمند ساخت مدل نیست
  • میتواند برای طبقه بندی یا رگراسیون استفاده شود
معایب KNN :
  • وقتی حجم داده ها خیلی زیاد باشد سرعت الگوریتم به شکل قابل توجهی کاهش میابد.
  • هزینه محاسبات الگوریتم بالا است.

مطالعه بیشتر

تیر ۸, ۱۳۹۹

۰ پاسخ به "KNN یاk-nearest neighbor"

ارسال یک پیام

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

X