021-71053903 [email protected] پشتیبانی از شنبه تا چهارشنبه ساعت 9 الی 16

اولین پروژه یادگیری ماشین ( Hello Word Machine Learning )

با سلام و عرض ادب خدمت تمامی دانشپذیران خوب وبسایت پایتونی با یک مقاله دیگر در خدمت شما عزیزان هستیم تا شما را با اولین پروژه یادگیری ماشین ( Hello Word Machine Learning ) با دنیای هوش مصنوعی آشنا کنیم خوب همانطور که میدانید پروژه های یادگیری ماشین پروژه هایی به شدن پیچیده و نیازمند زمان برای یادگیری هستند و شاید شما به عنوان یک کار اموز ساده یادگیری ماشین و یا هوش مصنوعی هفته ها درگیر یک پروژه معمولی یادگیری ماشین باشید تمام سعی ما در این مقاله این است که به ساده ترین شکل ممکن یک پروژه یادگیری ماشین را برای شما به نمایش بگذاریم و آموزش دهیم تا این سختی کمی از آن کاسته شود و بتوانید به راحتی هر چه تمام تر با دنیای یادگیری ماشین آشنا شوید با ما در ادامه مقاله همراه باشید .

کوچکترین پروژه یادگیری ماشین در دنیا که شما را برای شروع کار با هوش مصنوعی و یادگیری ماشین حتما وسوسه خواهد کرد .

یادگیری ماشین بسیار جذاب و شیرین  است! و اینترنت دارای حجم زیادی از موضوعات و مقالات در مورد یادگیری ماشین است.

اکثر مبتدیان برای یادگیری ماشین از محتوای زیادی استفاده می کنند تا اینکه یک برنامه کوچک را به تنهایی امتحان کنند. از آنجا که اکثر آموزش ها  برای مبتدیان را با همه آمار ، پاکسازی داده ها ، جبر خطی ، ریاضیات پیچیده ، یادگیری پایتون یا R. غرق می کند ، بنابراین مبتدیان ترجیح می دهند به جای ایجاد چیزی ، محتوای بیشتری مصرف کنند. مبتدیان برای درک مفاهیم به یک پروژه کوچک “Hello World” نیاز دارند. اگر از علاقه مندان به یادگیری ماشین هستید و اگر اولین برنامه یادگیری ماشین خود را ننوشته اید ، این آموزش / پروژه برای شما مناسب است.

 

خوب بی مقدمه بریم سراغ اصل مطلب ، مراحل مربوط به پروژه یادگیری ماشین:

مراحل زیر برای ایجاد یک پروژه هوش مصنوعی بر مبنای یادگیری ماشین به خوبی طراحی شده تا شما بتوانید با دنبال کردن مراحل زیر پروژه خود را اجرا کنید :

دقت داشته باشید ۴ مرحله اصلی زیر در هر پروژه یادگیری ماشینی باید به درستی و دقت اجرا شود پس طبق مراحل زیر پیش روی کنید :

 

  1. درک و تعریف مشکل
  2. تجزیه و تحلیل و آماده سازی داده ها
  3. الگوریتم ها را اعمال کرده و مدل های خود را آموزش دهید
  4. سپس نتیجه را پیش بینی کنید

 

اولین پروژه ما

اجازه دهید حقوق یک دانشمند داده را بر اساس سابقه کار وی در سالها پیش بینی کنیم

بهترین راه برای یادگیری یک پلت فرم و یا فرم ورک یا ابزار جدید این است که به طور کامل و عملی روی یک روی آن پروژه کار کنید و مراحل کلیدی را پوشش دهید. از بارگذاری داده ها ، پاکسازی داده ها ، جمع بندی داده ها ، ارزیابی الگوریتم ها و در نهایت انجام برخی پیش بینی ها.

 

برای این که ما پروژه خود را پیش ببریم از یک مجموعه داده ( همان دیتاست ) ساده آموزشی استفاده کنیم:

نکته : اگر نمیدانید دیتاست چیست از این مقاله استفاده کنید.

طرح مسئله : ما قصد داریم براساس سابقه کار یک فرد که شغل آن دانشمنده داده یا همان Data science می باشد حقوق آن شخص را در سال های آینده محاسبه کنیم.

چرا حل این مشکل برای مبتدیان خوب است:

این پروژه دارای ۳ ویژگی اصلی خارق العاده می باشد :

  • این یک مشکل ساده است که به یک متغییره رگرسیون خطی ساده نیاز مند است و ما می توانید حقوق را به دلار در آن با اسفاده از هوش مصنوعی پیش بینی کنیم .
  • ویژگی ها عددی هستند ، بنابراین باید نحوه بارگیری و مدیریت داده ها را مشخص کنید و علاوه بر این ، هیچ گونه پاکسازی یا تغییر داده ها مورد نیاز نیست.
  • مجموعه داده فقط دارای 2 ویژگی و 10 ردیف است ، بدین معنی که کوچک است و به راحتی در حافظه جا می گیرد و تفسیر آن آسان است.

بنابراین ، برای درک بیان مسئله وقت بگذارید. در هر مرحله به مرحله در پروژه پیش روید کنید تا کامل یادبگیرید .

 

شما می توانید به سادگی بر روی دستورات کلیک کرده و دستورات را کپی کرده و در برنامه خود جایگذاری کنید

نکته :‌ توجه داشته باشید که برای تکمیل این پروژه به پایتون با کتابخانه های یادگیری ماشین نصب شده در سیستم عامل خود نیاز دارید.

 

 

مرحله اول : بارگذاری مجموعه داده (دیتاست) حقوق و دستمزد

برای شروع راه اندازی نرم افزار پایتون را باز کنید :

python

توجه داشته باشید اگر از محیط های توسعه مثل PyCharm , Atom , VsCode استفاده می کنید دیگر نیاز به راه اندازی محیط توسعه ندارید .

 

اجازه دهید مطمئن شویم که محیط پایتون در حال کار است. دستور زیر را در ترمینال کپی کنید تا بررسی کنید که آیا به درستی کار می کند یا خیر !

print("Hello World")

 

خوب بعد از اجرای دستور بالا باید خروجی زیر را از نرم افزار خود دریافت کنید :

>>>‌ Hello World

 

خوب و خوب ، اجازه دهید شروع به نوشتن اولین برنامه خود کنیم. اول از همه مهم است که ما همه کتابخانه های مورد نیاز را برای پروژه خود وارد نرم افزار کنیم. بنابراین دستورات زیر را در ترمینال کپی-پیست کنید. (می توانید همه آنها را یکجا کپی کنید)

https://pythoniha.ir/wp-content/uploads/datasets/data-scientist-salaries.cc

#Load training dataset
url = "https://pythoniha.ir/wp-content/uploads/datasets/data-scientist-salaries.cc"
names = ['Years-experience', 'Salary']
dataset = pandas.read_csv(url, names=names)

 

خلاصه داده ها و تجزیه و تحلیل انجام دهید

اجازه دهید نگاهی به مجموعه داده های آموزشی ما بیندازیم:

ابعاد مجموعه داده ها: با استفاده از ویژگی shape مقدار ردیف و ستون خود را بیابید

# shape
print(dataset.shape)

نتیجه: (10،2) ، یعنی مجموعه داده ما دارای 10 سطر و 2 ستون است

 

برای مشاهده 10 ردیف اول مجموعه داده ما از کامند زیر استفاده می کنیم :

print(dataset.head(10))

نتیجه:

 

 

خلاصه آماری داده ها شامل شمارش ، میانگین ، حداقل و حداکثر و چند درصد را بیابید باید برای این کار از دستور زیر استفاده کنید :

print(dataset.describe())

و باید نتیجه زیر را مشاهده کنید :

 

 

مصور سازی داده ها و سپس روی آن ها تجزیه تحلیل انجام دهید

اکنون که کتابخانه ها را بارگذاری کرده ایم ، مجموعه داده ها را وارد کرده و برخی از اعداد را خرد کرده ایم. وقت آن است که  داده ها را بررسی کرده و آنها را درک کنیم.

 

اجازه دهید با استفاده از نمودار نمودار نگاهی به مجموعه داده ها بیندازیم. دستورات زیر را کپی کنید تا نمودار روی مجموعه داده ما براتان ترسیم شود:

#visualize
dataset.plot()
plt.show()

 

 

همانطور که در نمودار بالا ، ما دو پارامتر داریم. سابقه کاری و حقوق با خط نارنجی همبستگی بین این دو است.

 

 

تقسیم داده ها

در یادگیری ماشین ما دو نوع مجموعه داده داریم:

  • مجموعه آموزشی – برای آموزش مدل ما استفاده می شود
  • مجموعه داده های آزمایش – برای آزمایش اینکه آیا مدل ما پیش بینی های دقیقی انجام می دهد ، مورد استفاده قرار می گیرد

 

از آنجا که مجموعه داده ما کوچک است (10 رکورد) ، ما از 9 رکورد برای آموزش مدل و 1 رکورد برای ارزیابی مدل استفاده خواهیم کرد. دستورات زیر را کپی کنید تا مجموعه داده های ما آماده شود.

X = dataset[['Years-experience']]
y = dataset['Salary']
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1, random_state=101)

 

 

آموزش مدل

اکنون که داده ها را تجزیه و تحلیل کرده ایم و مجموعه Test و Train خود را آماده کرده ایم. ما از دستورات زیر برای آموزش مدل خود استفاده می کنیم. برای این مثال ما در حال انتخاب رگرسیون خطی هستیم زیرا سعی داریم یک عدد پیوسته را پیش بینی کنیم , آن هم (حقوق) است که باید پیش بینی شود .

from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(X_train,y_train)

 

 

آزمایش مدل

ما مدل آموزش دیده خود را داریم و اکنون باید از آن برای پیش بینی استفاده کنیم.با استفاده از مجموعه داده آزمایشی که برای تخمین دقت مدل خود داریم آموزش دادیم استفاده می کنیم تا یک مدل پیش بینی بسازیم .

برای این کار از تکه کد زیر استفاده می کنیم‌:

predictions = model.predict(X_test)
print(accuracy_score(y_test,predictions))

 

ما 1.0 دریافت می کنیم که برای مدل ما دقت 100 درصد است که نمره دقت ایده آلی محصوب می شود.در سیستم های آزمایشی  ، هر مدل آزمایشی دقت  بیش از 90 درصد را داشته باشد یک مدل موفق محسوب می شود.

در ضمن ما همچنین می توانیم مدل خود را با ورودی خود آزمایش کنیم.

به طور مثال بیایید سعی کنیم یک فرد با 6.3 سال سابقه کاری چقدر می تواند درآمد کسب کند:

print(model.predict(6.3))

نتیجه: [163000.]. مدل ما 163k را برای شخصی با 6.3 سال تجربه تخمین زده است.

 

خوب شاید خودتان هم باورتان نشود ولی شما اولین پروژه هوش مصنوعی خود را انجام دادید بهتون تبریک میگم !

حالا استراحت کنید ، برای پیاده روی به دنبال آن بروید یا با نشان دادن Netflix که مشتاق آن هستید خود را درمان کنید.

 

خلاصه

امیدوار هستیم اولین پروژه یادگیری ماشین کمک شایانی به شما بکند تا بتوانید سکوی پرتابی برای شما باشد به سمت پروژه های بعدی.

اولین پروژه یادگیری ماشینبه طور خلاصه ، در این آموزش ، شما گام به گام نحوه وارد کردن ، تجزیه و تحلیل و پیش بینی استفاده از اولین پروژه یادگیری ماشین خود را در پایتون یادگرفتید کرده اید اما قدم بعدی چیست ؟

دوباره این آموزش را مرور کنید تا درک خوبی نسبت به دنیای یادگیری ماشین پیدا کنید .سوالات خود را لیست کرده و به صورت آنلاین درباره آنها تحقیق کنید. سعی کنید از پروژه دیگر هم بهره ببرید  یک پروژه یادگیری ماشین دیگر را امتحان کنید و سعی کنید هر روز یک تجربه جدید کسب کنید !

 

 

منبع :

مقالات مرتبط :

محمدرضا حسنی

224 مطلب منتشر شده

دانش آموخته رشته فناوری اطلاعات / موسس پایتونی ها

درباره این مطلب نظر دهید !

مطالب پرمخاطب پایتونی ها

Logistic regression

Logistic Regression چیست؟

3
دقیـقه مطالعه
ادامه ...
Hierarchical Clustering

الگوریتم Hierarchical

3
دقیـقه مطالعه
ادامه ...

محصولات فروش پایتونی ها

%60
تخفیف

آموزش فیگما (Figma)

30,000 تومان
3
%69
تخفیف

آموزش برنامه نویسی پایتون

35,000 تومان
2