منوهای نصب در پنل مدیریت

  • ورود
  • سبد خرید شما خالی است.

semi-supervised learning چیست؟

الگوریتم های یادگیری ماشین امروزه می توانند به طور گسترده به سه دسته طبقه بندی شوند:

به غیر از reinforcement learning دو دسته اصلی مشکلات یادگیری ماشین supervised learning و unsupervised learning است. تفاوت میان این دو این است که مجموعه داد ها supervised learning هر دسته label خروجی مرتبط با اون دسته را دارد درصورتی که در unsupervised learning این موضوع دیده نمی شود.

یکی از معایب اساسی الگوریتم های supervised learning این است که مجموعه داده ها باید توسط یک مهندس machine learning یا Date Scientist دستکاری شود. این فرایند بسیار وقت گیر است ، به خصوص هنگامی که به حجم زیادی از داده ها برخورد کنیم . یکی از معایب unsupervised learning هم محدود بودن طیف کاری که انجام می دهد است.

به دلیل وجود این معایب، مفهوم Semi-Supervised learning شرح داده شد. در این نوع یادگیری، الگوریتم با ترکیبی از داده های دارای label و بدون label آموزش داده می شوند. به طور کلی ، این ترکیب حاوی مقدار بسیار کمی از داده های دارای برچسب و مقدار بسیار زیادی از داده های بدون برچسب است، رویه اصلی استفاده از این نوع یادگیری این است که ، برنامه نویس با استفاده از الگوریتم unsupervised learning ، داده های مشابه را جمع می کند و سپس از داده های دارای برچسب موجود برای برچسب زدن بقیه داده های بدون برچسب استفاده می کند. موارد استفاده از این الگوریتم تقریبا مشابه بقیه الگوریتم هاست، کسب اطلاعات بدون برچسب بسیار ساده و برچسب زدن به داده های ذکر شده بسیار سخت است.

semi-supervised learning

به این صورت میشود گفت که کارکرد این سه مدل الگوریتم این طور است که ، supervised learning را می توان به یک معلم تشبیه کرد کهبه دانش آموز هم در مدرسه و هم در خانه کمک می کند. همینطور unsupervised learning می توان دانش آموزی دانست که خود باید مسائل را متوجه شود و semi-supervised learning را می توان اینطور دانست که معلم مفهومی را در کلاس تدریس می کند و به عنوان تکالیف که مبتنی بر مفاهیم تدریس شده مشابه است سوالاتی طرح می کند.

الگوریتم semi-supervised مفاهیم زیر را درباره داده ها فرض می کند:

  • فرض استمرار : این الگوریتم فرض می کند که موضوع های نزدیک به یکدیگر ، دارای برچسب یکسانی هستند.
  • فرض خوشه : داده ها را می توان به خوشه(Cluster) های گسسته تقسیم کرد و نقاطی که در یک خوشه قرار بگیرند قطعا دارای برچسب خروجی مشابه هستند
  • فرضیه چند ظرفیتی : داده ها معمولا روی مانیفولد هایی با ابعاد بسیار کمتر از فضای ورودی قرار دارند. این فرض اجازه می دهد تا از مسافت ها و تراکم هایی که روی یک منیفولد تعریف شده اند استفاده شود.

کاربرد های عملی semi-supervised learning:

  • تحلیل گفتار
  • طبقه بندی محتوای اینترنت
  • طبقه بندی ترتیب پروتئین ها

منبع : geeksforgeeks.org

ژوئن 25, 2020

۰ پاسخ به "semi-supervised learning چیست؟"

ارسال یک پیام

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

question