021-71053903 [email protected] پشتیبانی از شنبه تا چهارشنبه ساعت 9 الی 16

دانلود دیتاست کلمات فارسی OCR

دانلود دیتاست کلمات فارسی OCR ( دیتاست Shotor )

 

محتویات دیتاست :

مجموعه کلمات OCR برای زبان فارسی

Shotor (به فارسی به معنی شتر) یک مجموعه داده مصنوعی رایگان برای OCR سطح Word است.

نسخه فعلی این مجموعه داده شامل 120000 تصویر در ابعاد خاکستری 50 * 100 و کلمات مربوطه است. کلمات فقط دارای حروف الفبا هستند.

توجه: برای آموزش یک مدل قوی برای یادگیری ماشین یا یادگیری تقویتی مانند مقیاس بندی ، ترجمه ، نویز افزودنی و … را روی تصاویر اعمال کنید.
برای دیدن نمونه ای از استفاده از مجموعه داده Shotor این نوت بوک را ببینید:

برای ساخت این مجموعه داده از منابع زیر استفاده شده است :

 

نکته * :

تصاویر با استفاده از چندین فونت ایجاد شده اند:

 

این مجموعه داده توسط آقای امیر عباس اسدی جمع آوری و ساخته شده و وبسایت پایتونی ها فقط این مجموعه داده را بازنشر کرده و هیچ استفاده تجاری از این مجموعه داده توسط پایتونی صورت نگرفته و در صورت ناراضی بودن صاحب اثر از وبسایت پایتونی ها حذف خواهد شد .

 

منبع :

  • https://www.kaggle.com/amir137825/persianocrdataset

مقالات مرتبط :

دانلود باکس

محمدرضا حسنی

224 مطلب منتشر شده

دانش آموخته رشته فناوری اطلاعات / موسس پایتونی ها

درباره این مطلب نظر دهید !

محصولات فروش پایتونی ها

%60
تخفیف

آموزش فیگما (Figma)

30,000 تومان
3
%69
تخفیف

آموزش برنامه نویسی پایتون

35,000 تومان
2