021-71053903 [email protected] پشتیبانی از شنبه تا چهارشنبه ساعت 9 الی 16

دانلود دیتاست MNIST Digit Recognizer

اصول بینایی رایانه را با داده های معروف MNIST یاد بگیرید

محتوای دیتاست‌ :

فایل های داده train.csv و test.csv حاوی تصاویری در مقیاس معمول، خاکستری از ارقام نوشته شده با دست است ،این ارقام از عدد ۱ تا 9 را شامل می شود .

MNIST یک پایگاه داده است. مخفف کلمه “Modified National Institute of Standards and Technology” است. پایگاه داده MNIST شامل ارقام دست نویس (0 تا 9) است و می تواند یک پایه برای آزمایش سیستم های پردازش تصویر فراهم کند.

MNIST “Hello World'”  از یادگیری ماشین است. دانشمندان داده یا دیتا ساینتیک ها برای اطمینان از کارکرد یک ساختار یا Framework جدید ، الگوریتمی را روی مجموعه داده های MNIST آموزش می دهند.

MNIST به دو مجموعه داده تقسیم می شود: مجموعه Train دارای 60،000 مثال از اعداد دست نوشته شده و مجموعه TEST دارای 10،000 است. MNIST زیرمجموعه یک مجموعه داده بزرگتر است که در National Institute of Standards and Technology موجود است. تمام تصاویر آن اندازه یکسانی دارند و درون آنها ، ارقام در مرکز قرار گرفته و اندازه نرمال سازی شده.

از آنجا که MNIST یک مجموعه داده با برچسب ( همان هشتگ ) است که تصاویر اعداد دست نوشته را با نام عدد مربوطه جفت می کند ، می توان از آن در آموزش نظارت شده برای آموزش طبقه بندی استفاده کرد. این یک مثال خوب در کنار Fei Fei Li’s ImageNet است که نشان می دهد چگونه یک مجموعه داده خوب و دارای برچسب می تواند علت یادگیری ماشین را به طور گسترده تری پیش ببرد. نمونه های بیشتری از مجموعه داده های باز در اینجا وجود دارد.

شناخت اعداد اول دست نویس و به عنوان بخشی از یک پروژه بزرگتر بود برای کمک به بانک ها برای پردازش تصویر خودکار  در ضمینه چک های بانکی که اولین بار در سال 1990 اختراع شد .

 

ابعاد هر تصویر طول 28 پیکسل  و عرض 28 پیکسل است که در مجموع ضریب  784 پیکسل را تشکیل می دهد . هر پیکسل دارای یک مقدار پیکسل است که به آن مربوط می شود ، این نشان دهنده روشنایی یا تاریکی آن پیکسل است ، با اعداد بالاتر به معنی تاریک تر. این مقدار پیکسل یک عدد صحیح بین 0 و 255 است.

مجموعه داده های آموزش (train.csv) ، 785 ستون دارد. اولین ستون آن “label” نام دارد ، رقمی است که توسط کاربر ترسیم شده است. بقیه ستون ها حاوی مقادیر پیکسل تصویر مرتبط هستند.

 

هر ستون پیکسل در مجموعه آموزش نامی مانند pixelx دارد که x یک عدد صحیح بین 0 و 783 است. برای قرار دادن این پیکسل روی تصویر ، فرض کنید که ما x را x = i * 28 + j تجزیه کرده ایم ، جایی که i و j عدد صحیح بین 0 تا 27 هستند. سپس pixelx در ردیف i و ستون j از یک ماتریس 28 28 28 واقع شده است (نمایه سازی توسط صفر).

 

مقالات مرتبط :

دانلود باکس

محمدرضا حسنی

224 مطلب منتشر شده

دانش آموخته رشته فناوری اطلاعات / موسس پایتونی ها

درباره این مطلب نظر دهید !

مطالب پرمخاطب پایتونی ها

محصولات فروش پایتونی ها

%60
تخفیف

آموزش فیگما (Figma)

30,000 تومان
3
%69
تخفیف

آموزش برنامه نویسی پایتون

35,000 تومان
2