مقاله ترجمه شده درباره کاربرد تشخیص خارج از زبان (out-of-language) برای تشخیص عبارت گفتاری – سال 2010
مشخصات مقاله:
عنوان فارسی مقاله:
کاربرد تشخیص خارج از زبان (out-of-language) برای تشخیص عبارت گفتاری
عنوان انگلیسی مقاله:
Application Of Out-Of-Language Detection To Spoken Term Detection
کلمات کلیدی مقاله:
تشخیص عبارت گفتاری (STD)، بازشناسی گفتار پیوسته با واژگان بزرگ (LVCSR)، درجه اطمینان (CM)، تشخیص خارج از زبان (OOL).
مناسب برای رشته های دانشگاهی زیر:
مهندسی کامپیوتر
مناسب برای گرایش های دانشگاهی زیر:
هوش مصنوعی
وضعیت مقاله انگلیسی و ترجمه:
مقاله انگلیسی را میتوانید به صورت رایگان با فرمت PDF از باکس زیر دانلود نمایید. ترجمه این مقاله با فرمت WORD – DOC آماده خریداری و دانلود آنی میباشد.
فهرست مطالب:
چکیده
1.مقدمه
2- STD مبتنی بر شبکههای گفتاری که توسط LVCSR ایجاد شدهاند
1-2- سیستم LVCSR
2-2 – ارزیابی سیستم STD بهتنهایی
3- واحد تشخیص OOL
1-3- ارزیابی واحد تشخیص OOL بهتنهایی
4- ترکیب سیستمهای تشخیص OOL و STD
5- بحث و نتیجهگیری
قسمتی از مقاله انگلیسی و ترجمه آن:
1. INTRODUCTION
Spoken Term Detection (STD) [1] aims at detecting a word or phrase in unconstrained speech and is typically used in searching large archives of recorded speech in many applications (e.g., meeting data, telephone speech, unconstrained conversations). Traditional STD systems perform two steps denoted as indexing and searching. First, the input speech is processed (decoded) and the outputs obtained are stored in the index. i.e., the speech is tagged using the sequence of recognized words or phonemes. Then, the index is searched in order to return the location of the determined term. Two different approaches are currently used in STD which differ in the basic unit used for indexing. In the ¿rst case, the index is represented by a word lattice obtained by a Large Vocabulary Continuous Speech Recognition (LVCSR) system. In the second case, the index is based on a phoneme lattice obtained by phoneme recognition.
1- مقدمه
تشخیص عبارت گفتاری (STD)، به تشخیص یک واژه یا عبارت موجود در گفتار نامحدود کمک میکند و معمولاً برای جستجو در آرشیوهای بزرگ فایلهای ضبطشدهی گفتاری، در بسیاری از کاربردها استفاده میشود (بهعنوانمثال اطلاعات جلسات، گفتگوی تلفنی، مکالمات نامحدود). سیستمهای STD سنتی 2 مرحله، ازجمله، فهرست سازی (نمایهسازی) و جستجو کنندگی را اجرا میکردند. اول، گفتار ورودی پردازش (رمزگشایی) میشود و خروجیهای بهدستآمده در فهرست (نمایه) ذخیره میشوند. به این معنی که گفتار، با استفاده از یک توالی از گفتارها (کلمات) یا اصوات بازشناسی شده، برچسب میخورد. سپس، این فهرست (نمایه)، بهمنظور اعاده ی موقعیت عبارت تعیینشده، مورد جستجو قرار میگیرد.
اخیراً، 2 رویکرد مختلف در STD استفاده میشود که در واحد پایه ی استفادهشده برای فهرست سازی (نمایهسازی)، متفاوت هستند. در اولین مورد، فهرستی (نمایه ای) که توسط یک شبکه ی گفتاری، ارائه میشود، بهوسیلهی یک سیستم بازشناسی گفتار پیوسته ی با فرهنگ لغت بزرگ (LVCSR) به دست میآید. در مورد دوم، فهرست (نمایه)، بر اساس یک شبکه ی صوتی (واجی) میباشد که بهوسیلهی بازشناسی صوتی (واجی) به دست میآید.