021-71053903 [email protected] پشتیبانی از شنبه تا چهارشنبه ساعت 9 الی 16

مدل جنگل تصادفی

Random Forest Regression یا مدل جنگل تصادفی زیرمجموعه یادگیری نظارت شده است. این مدل مجموعه ای از چند درخت تصمیم گیری است.

پیش بینی با محاسبه میانگین پیش بینی هر درخت محاسبه می شود.این باعث می شود که مدل جنگل تصادفی به یک روش مدل سازی قوی تبدیل شود که بسیار قدرتمند تر از یک درخت تصمیم گیری است.

هر درخت روی مجموعه ای از داده ها آموزش داده می شود.

در یادگیری ماشین الگوریتم Random Forest Regression برای حل مشکلات رگرسیون به نسبت سایر الگوریتم ها محبوبیت بیشتری دارد.

دلیل محبوبیت مدل جنگل تصادفی :
  • وجود روابط غیرخطی و پیچیده بین داده ها و برچسب ها
  • اگر سایر مدل هل باعث ریزش بیش از حد داده ها شود. مدل جنگل تصادفی بهترین انتخاب است. زمانی که عمق درخت را محدود می کنیم، واریانس کاهش یافته ولی بایس افزایش میابد. برای پایین نگه داشتن هر دو ، Random Forest Regression تعداد زیادی درخت تصمیم گیری را باهم ترکیب می کند و به این ترتیب باعث کاهش نویز می شود.
  • وابستگی آن به نویز در داده های آموزش کمتر است.

نحوه کار کردن الگوریتم Random Forest Regression:

  • انتخاب تصادفی N داده از مجموعه داده ها
  • ساخت درخت تصمیم گیری براساس داده های انتخاب شده
  • انتخاب تعداد درختانی که در الگوریتم خود می خواهید و تکرار دو مرحله بالا
  • برای حل مسئله رگراسیون، هر درخت تصمیم گیری مقداری را به عنوان خروجی پیش بینی می کند. مقدار نهایی را می توان با محاسبه میانگین خروجی درخت ها برای هر داده، پیش بینی کرد.

random forest regression

مزایا مدل جنگل تصادفی:
  • نقطه قوت الگوریتم جنگل تصادفی بر اساس حجم بالای داده ها استوار است. بنابراین بایاس الگوریتم کاهش میابد.
  • این الگوریتم بسیار پایدار است. اضافه شدن یک داده جدید تاثیر زیادی روی مدل نمی گذارد. اما تاثیر زیادی روی یک درخت تصمیم گیری می گذارد اما تاثیر آن روی همه درخت ها دشوار است.
  • این الگوریتم حتی با از دست دادن تعداد زیادی از داده ها و یا حتی بدون مقیاس بندی مناسب به خوبی کار می کند.
معایب مدل جنگل تصادفی:
  • نقطه ضعف این الگوریتم در پیچیدگی آن است. به دلیل تعداد زیاد درخت های تصمیم گیری نیاز به منابع محاسباتی زیادی دارد.
  • به دلیل پیچیدگی زیاد، به نسبت سایر الگوریتم ها به زمان بیشتری برای آموزش داده ها نیاز دارد.

مطالعه بیشتر

maryam keshvari

31 مطلب منتشر شده

کارشناسی ارشد فناوری اطلاعات علاقمند به زبان برنامه نویسی python و هوش مصنوعی

درباره این مطلب نظر دهید !

مطالب پرمخاطب پایتونی ها

KNN

KNN یاk-nearest neighbor

2
دقیـقه مطالعه
ادامه ...
scipy

کتابخانه scipy

3
دقیـقه مطالعه
ادامه ...

محصولات فروش پایتونی ها

%60
تخفیف

آموزش فیگما (Figma)

30,000 تومان
3
%69
تخفیف

آموزش برنامه نویسی پایتون

35,000 تومان
2