ترجمه مقاله زبان شناسی اجتماعی و برنامه نويسی – سال 2015
مشخصات مقاله:
عنوان فارسی مقاله:
زبان شناسی اجتماعی و برنامه نويسی
عنوان انگلیسی مقاله:
Sociolinguistics and Programming
مناسب برای رشته های دانشگاهی زیر:
مهندسی کامپیوتر
مناسب برای گرایش های دانشگاهی زیر:
مهندسی نرم افزار، برنامه نویسی کامپیوتر
وضعیت مقاله انگلیسی و ترجمه:
مقاله انگلیسی را میتوانید به صورت رایگان با فرمت PDF از باکس زیر دانلود نمایید. ترجمه این مقاله با فرمت WORD – DOC آماده خریداری و دانلود آنی میباشد.
فهرست مطالب:
چكيده
I. مقدمه و هدف
II. زمينه
الف. زبانشناسي اجتماعي
ب. يادگيري ماشين
ج. الگوريتمهاي طبقهبندي
د. روش اعتبارسنجي ضربدري
ه. معيارهاي ارزيابي
III. پژوهشهاي مرتبط
الف. زبانشناسي نرمافزاري
ب. تعيين جنسيت
ج. تحليل تاليف
IV. روش شناسي
v. نتايج و بحث
VI. محدوديتها
VII. نتيجهگيري و پژوهشهاي آتي
قسمتی از مقاله انگلیسی و ترجمه آن:
Abstract
This paper focuses on the use of machine learning techniques for the analysis of computer programs in order to acquire information about an author’s gender. There are few existing studies that address the relationship between linguistics and programming; however, in many areas where language is analyzed it is possible to mine important information about the users of that language associated with set of attribute or coding style. In this work we use open source implementations of machine learning algorithms, specifically, nearest neighbor (K*), decision tree (J48), and Bayes classifier (Naïve Bayes). These algorithms were applied to C++ programs which were associated with sociolinguistic information about the program authors. Our goal was to classify the programs according to the gender of the author. As indicated by our initial results we have been able to achieve precision of 72.3%, recall of 72%, and f-measure of 71.9% which demonstrates that we can predict the gender of the authors of C++ programs.
I. INTRODUCTION
AND MOTIVATION IN the field of sociolinguistics it is known that individual differences in the use of a language within a society can affect or reflect social factors. Linguistic variables correlate with social variables such as age, socio-economic status, gender, ethnicity, and region to create sociolinguistic variation [1]. However, very few researchers have applied this analysis to the field of computer programming. We are thus interested in answering the following question: do social factors impact the development of C++ programs? To begin to answer this question here we report on our efforts to categorize C++ programs based on the gender of the programmers.
چكيده
اين مقاله به كاربرد تكنيكهاي يادگيري ماشين در تحليل برنامههاي كامپيوتري، با هدف كسب اطلاعات درباره جنسيت نويسنده ميپردازد. پژوهشهاي موجود اندكي به رابطه ميان زبانشناسي و برنامهنويسي ميپردازند: با اين حال، در بسياري از زمينههايي كه زبان در آن تحليل ميشود، ميتوان اطلاعات مهمي درباره كاربران آن زبان به دست آورد، كه به صفات يا شيوهي كدنويسي مربوط ميشود. در اين پروژه از اجراي متن باز الگوريتمهاي يادگيري ماشين، به طور خاص نزديكترين همسايه (K*) ، درخت تصميم (J48)، و طبقهبندي كننده بيز (Na¨ıve Bayes) استفاده كردهايم. اين الگوريتمها بر روي برنامههاي C++ ، كه با اطلاعات زبانشناسي اجتماعي برنامهنويسان مرتبط بودند، استفاده شدند. هدف ما، طبقهبندي اين برنامهها بر اساس جنسيت نويسندگان آنها بود. همانطور كه از يافتههاي اوليه آشكار است، توانستهايم به دقت 72.3 درصد، حساسيت 72 درصد، و معيار f-measure 71.9 درصد دست بيابيم، كه نشان ميدهد ميتوانيم جنسيت نويسندگان برنامههاي C++ را پيشبيني كنيم.
I. مقدمه و هدف
در زمينهي زبانشناسي اجتماعي، اين يك امر جاافتاده است كه تفاوتهاي فردي در استفاده از زبان درون يك جامعه، ميتوانند بر عوامل اجتماعي تاثير گذاشته، يا نمايانگر آنها باشد. متغيرهاي زبانشناختي، با متغيرهاي جامعهشناختي مانند سن، جايگاه اجتماعي-اقتصادي، جنسيت، نژاد، و ناحيه همبستگي دارند. 1 با اين حال، محققين اندكي از اين تحليل در زمينه برنامهنويسي كامپيوتري استفاده كردهاند. به همين دليل است كه ما به دنبال پاسخ به اين پرسش هستيم: آيا عوامل اجتماعي بر نوشتن برنامههاي C++ تاثير ميگذارند؟ براي پاسخ به اين سوال، اول در اينجا گزارشي از تلاشهايمان براي طبقهبندي برنامههايC++ بر اساس جنسيت برنامهنويسان، ارايه ميكنيم.