021-71053903 [email protected] پشتیبانی از شنبه تا چهارشنبه ساعت 9 الی 16

دانلود دیتاست Persian Consonant Vowel Combination

دانلود دیتاست Persian Consonant Vowel Combination

ترکیب حروف صدادار فارسی

PCVC

اگر می خواهید از این مجموعه داده استفاده کنید ، لطفاً به این مقاله مراجعه کنید:

Malekzadeh, S., Gholizadeh, M.H. and Razavi, S.N., 2018. Persian phonemes recognition using PPNet. arXiv preprint arXiv:1812.08600.

 

توضیح مختصر :

این مجموعه داده اولین مجموعه داده گفتار مبتنی بر واجه در کل جهان و همچنین اولین مجموعه داده گفتار فارسی رایگان است که به محققان گفتار فارسی کمک می کند. در ضمن توسعه این مجموعه داده هنچنان ادامه دارد :

این مجموعه شامل 23 صامت فارسی و 6 مصوت است. نمونه های صوتی همه ترکیبی از مصوت ها و صامت ها هستند (138 نمونه برای هر بلندگو) با طول 30000 نمونه داده. میزان نمونه گیری از همه نمونه های گفتار 48000 است ، به این معنی که در هر 1 ثانیه 48000 نمونه صدا وجود دارد. در هر نمونه ، صدا با صامت شروع می شود و سپس صدای مصوت وجود دارد و در نهایت بی صدا است. طول سکوت به طول ترکیب صامت و مصوت بستگی دارد. به عنوان مثال اگر ترکیب در 20000 نمونه داده به پایان برسد ، بنابراین بقیه 10000 نمونه (تا 30000 ، طول هر نمونه صوتی) سکوت است.

 

نحوه استفاده از داده ها :

هر فایل فقط شامل یک ماتریس “x” است.
علامت “N” (N به عنوان شماره) در فهرست “Samples” (مانند نمونه “S00012.mat”) به این معنی است که این نمونه نمونه نهم از بلندگوی “S0001.mat” است.

 

استفاده در زبان برنامه نویسی پایتون :

برای استفاده از فایل های داده “.mat” در پایتون می توانید از کد زیر برای کپی ماتریس فایل در متغیر “aud” استفاده کنید (مسیر فعلی خود را به جای “MyPath” قرار دهید). هر فایل شامل یک ماتریس با ابعاد 1236 * 30000 است که 23 عدد به تعداد صامت ، 6 به تعداد مصوت و 30000 به طول نمونه صدا اشاره دارد. ترتیب واج ها درست مانند آنچه در اینجا نشان داده شده است.

# Reading it from current directory and putting the matrix of it in "aud" variable
import scipy.io  
mat = scipy.io.loadmat('Speaker1.mat')  
aud=(mat['x'])

 

سپاس فراوان از کسانی که به ما در توسعه مجموعه داده PCVC به ویژه بلندگوها کمک کردند: فریده جبرائیلی ، هدایت ملک زاده ، حامد
افجلند ، محمد عطایی زاده ، طاهره سالاری ، علیرضا آقایی ، پریسا سیف پور ، ساحل سلطانی ، مینا بایاراش ، میلاد عبدالله زاده ، صدرا ملک زاده ،…

 

  • لینک منبع :‌ https://github.com/smalekz/PCVC

مقالات مرتبط :

دانلود باکس

محمدرضا حسنی

224 مطلب منتشر شده

دانش آموخته رشته فناوری اطلاعات / موسس پایتونی ها

درباره این مطلب نظر دهید !

محصولات فروش پایتونی ها

%60
تخفیف

آموزش فیگما (Figma)

30,000 تومان
3
%69
تخفیف

آموزش برنامه نویسی پایتون

35,000 تومان
2