ترجمه مقاله شناسایی گویشور در گفتار نجوایی – سال 2018
مشخصات مقاله:
عنوان فارسی مقاله:
شناسایی گویشور در گفتار نجوایی: ارزیابی ویژگی های منتخب طنین و معیار های فاصله KNN
عنوان انگلیسی مقاله:
Speaker identification of whispering speech: an investigation on selected timbrel features and KNN distance measures
کلمات کلیدی مقاله:
شناسایی گویشور، توصیف گر طنین صوتی، گفتار نجوایی، تابع فاصله، نزدیک ترین همسایه K، ماتریس آمیختگی
مناسب برای رشته های دانشگاهی زیر:
مهندسی کامپیوتر
مناسب برای گرایش های دانشگاهی زیر:
مهندسی الگوریتم ها و محاسبات، هوش مصنوعی
وضعیت مقاله انگلیسی و ترجمه:
مقاله انگلیسی را میتوانید به صورت رایگان با فرمت PDF از باکس زیر دانلود نمایید. ترجمه این مقاله با فرمت WORD – DOC آماده خریداری و دانلود آنی میباشد.
فهرست مطالب:
چکیده
1- مقدمه
2- توصیف سیستم
2-1 دیتابیس گویشور
2-2 الگوریتم ترکیبی انتخاب ویژگی ها
2-3 توصیف کننده های صوتی انتخاب شده
2-4 طبقه بندی کننده نزدیک ترین همسایه K (KNN)
3- نتایج
3-1 صحت شناسایی برای حالت های مختلف کلام همراه با ویژگی های مختلف و توابع فاصله و برای افزایش تعداد ویژگی ها
3-2 ماتریس در هم ریختگی
4- جمع بندی
قسمتی از مقاله انگلیسی و ترجمه آن:
1 Introduction
Speaker analysis includes applications like speaker identification/verification, gender and age group labeling, accent/ dialect, etc. In any text-independent analysis of speaker, it is required to characterize the speaker’s voice by some unique parameters called features. The normal voiced phonation is considered as the important source for characterization or modeling of a speaker; as a rich resonance information is available in a high-energy periodic signal. However, while whispering, an air turbulence without vibrating vocal chord changes the general condition of phonation (Beigi 2012). This is the most probable difficulty among all other reasons discussed in the literature for whispering speaker identification. Significant changes found between whisper and neutral speech in terms of periodicity, formants’ location, and spectral slope boundaries of vowel regions. However, it is proved that vocal effort while whisper does not disturb unvoiced consonants as much (Fan and Hansen 2011). Hence, unvoiced part in neutral and whispered speech plays major role to identify speaker in neutral-whisper scenario. Secondly, speakers found it difficult to continue whispering for long duration (beyond 30 s). It is proved by good identification results for (i) long and whispered, and (ii) short and normal (non-whispered) compared to (iii) short and whispered (Foulkes and Sóskuthy 2017). So longer whisper (2–3 s) will consist of partial voiced phonation, thus increasing speaker identification accuracy.
1. مقدمه
تحلیل گویشور شامل کاربرد هایی مانند شناسایی / تایید ، مشخص کردن گروه های سنی و جنسیتی ، لهجه ، گویش و غیره می باشد. در هر تحلیل مستقل از متن در رابطه با گویشور، باید صدای گویشور با استفاده از بعضی از پارامتر های خاص که با نام ویژگی شناخته می شوند، توصیف شود. تولید صدای واکدار عادی به عنوان یک منبع مهم برای توصیف و یا مدل سازی گویشور مورد استفاده قرار می گیرد ؛ زیرا یک سری اطلاعات رزونانس غنی در سیگنال های دوره ای با انرژی بالا وجود دارد. اما در رابطه با گویش نجوایی، آشفتگی هوا بدون لرزش تار آوا موجب می شود که شرایط عمومی تولید صدا تغییر کند. این موضوع مهم ترین دشواری در میان دیگر دلایلی است که در مقالات مرتبط با شناسایی گویشور نجوایی مطرح شده است. تغییرات محسوسی بین نجوا و گفتار عادی از نظر حالت تناوبی، مکان فورمنت ها ، و شرایط مرزی شیب برای مکان حروف صدادار وجود دارد. اما، مشخص شده است که تلاش های آوایی در شرایط نجوا، موجب ایجاد آشفتگی زیاد در همخوان های بی واک نمی شود. ازین رو، بخش بی واک در گفتار عادی و گفتار نجوایی مهم ترین نقش برای شناسایی گویشور در سناریو گفتار عادی – نجوایی ایفا می کند. دوما، گویشور ها به سختی می توانند برای مدت زمان طولانی به حالت نجوایی صحبت کنند ( بیشتر از 30 ثانیه). ثابت شده است که برای 1) مدت زمان طولانی حالت نجوایی و 2 ) مدت زمان کوتاه گفتار عادی ( بدون نجوا) در مقایسه با 3) مدت زمان کوتاه گفتار نجوایی نتایج خوبی به دست می آید. بنابراین نجوا های طولانی تر ( 2 تا 3 ثانیه) شامل بخش هایی از تولید صدای واک دار ناقص می باشند و ازین رو موجب افزایش صحت شناسایی گویشور می شود.