ترجمه مقاله حداقل اتلاف حاشیه ای برای تشخیص چهره عمیق – سال 2020

 

 


 

مشخصات مقاله:

 


 

عنوان فارسی مقاله:

حداقل اتلاف حاشیه ای برای تشخیص چهره عمیق

عنوان انگلیسی مقاله:

Minimum margin loss for deep face recognition

کلمات کلیدی مقاله:

یادگیری عمیق، شبکه های عصبی کانولوشنی (CNN)، تشخیص چهره، حداقل اتلاف حاشیه ای (MML)

مناسب برای رشته های دانشگاهی زیر:

مهندسی کامپیوتر

مناسب برای گرایش های دانشگاهی زیر:

هوش مصنوعی، مهندسی الگوریتم ها و محاسبات

وضعیت مقاله انگلیسی و ترجمه:

مقاله انگلیسی را میتوانید به صورت رایگان با فرمت PDF از باکس زیر دانلود نمایید. ترجمه این مقاله با فرمت WORD – DOC آماده خریداری و دانلود آنی میباشد.

 


 

فهرست مطالب:

چکیده

1. مقدمه

2. از تابع Softmax Loss تا تابع حداقل اتلاف حاشیه ای

1-2 Sotmax Loss و Center Loss

2-2 اتلاف حاشیه ای و اتلاف محدوده

3-2 حداقل اتلاف حاشیه ای پیشنهادی

4-2 بحث

3. آزمایش ها

1-3 جزئیات آزمایش

2-3 تحلیل تاثیر بر پارامترهای β و M

3-3 چالش اول MegaFace در مجموعه داده FaceScrub

4-3 مقایسه با بهترین روش ها در مجموعه داده های LFW و YTF

5-3 مقایسه بیشتر در مجموعه داده SLLFW

6-3 نتایج براساس مجموعه داده های IJB-B و IJB-C

4. نتیجه گیری

 


 

قسمتی از مقاله انگلیسی و ترجمه آن:

1. Introduction
In the past ten years, deep neural network (DNN) based methods have achieved great progress in various computer vision tasks, including face recognition [1], person re-identification [2], object detection [3] and action recognition [4]. The progress on face recognition is particularly remarkable due largely to two important factors – larger face datasets and better loss functions. The quantity and quality of the face datasets used for training directly influence the performance of a DNN model in face recognition. Currently, there are a few large-scale face datasets that are publicly available, for example, MS-Celeb-1M [5], VGGFace2 [6], MegaFace [7] and CASIA WebFace [8]. As shown in Table 1, CASIA WebFace consists of 0.5M face images; VGGFace2 contains totally 3M face images but only from 9K identities; MS-Celeb-1M and MegaFace both contain more images and more identities, thus should have greater potential for training a better DNN model. However, both MS-Celeb-1M and MegaFace have the problem of long-tailed distribution [9], which means a minority of people owns a majority of face images and a large number of people have very limited face images. Using datasets with long-tailed distri- bution, the trained model tends to overfit the classes with rich samples thus weakening the generalisation ability on the longtailed portion [9].

1. مقدمه
در ده سال گذشته، روش های مبتنی بر شبکه عصبی عمیق (DNN) به پیشرفت عظیمی در زمینه تصویرهای رایانه ای شامل تشخیص چهره [1]، شناسایی مجدد افراد [2]، تشخیص اشیا و تشخیص اقدام دست یافته است. پیشرفت در حوزه تشخیص چهره به دلیل دو عامل مهم یعنی مجموعه داده های بزرگتر چهره و توابع اتلاف بهتر به دست آمده است.
کمیت و کیفیت مجموعه داده های چهره برای آموزش تاثیر مستقیمی بر عملکرد یک مدل DNN در تشخیص چهره دارند. این مجموعه داده ها به صورت عمومی در دسترس قرار دارند که نمونه آن MS-Celeb-1M [5]، VGGFace2 [6]، MegaFace [7] و CASIA WebFace [8] است. همانطور که در جدول 1 نشان داده شده است، مجموعه داده CASIA WebFace شامل تصاویر 0.5 M از چهره است؛ مجموعه داده VGGFace2 به طور کلی شامل تصاویر 3M چهره اما تنها از هویت های 9K است. مجموعه داده MS-Celeb-1M و MegaFace شامل تصاویر و هویت های بیشتری است، بنابراین می بایست دارای توان بالقوه بیشتری برای آموزش یک مدل DNN بهتر باشد. با این حال، هر دو مجموعه داده MS-Celeb-1M و MegaFace دارای مشکل توزیع long-tailed هستند [29] که به این معنا است که اقلیت افراد دارای بخش اعظیمی از تصاویر چهره هستند و تعداد زیادی از افراد دارای تصاویر چهره بسیار محدودی هستند. با استفاده از مجموعه داده ها با توزیع long-tailed، مدل آموزش دیده تمایل به تناسب بیش از حد با دسته های دارای نمونه زیاد دارد که سبب تضعیف توانایی تعمیم در بخش long-tailed می شود [9].

 


 

دانلود رایگان مقاله انگلیسی

خرید ترجمه مقاله

 


 

دیدگاهتان را بنویسید