ترجمه مقاله طبقه بندی گروه های سنی در شبکه های اجتماعی با استفاده از یادگیری عمیق – سال 2017
مشخصات مقاله:
عنوان فارسی مقاله:
طبقه بندی گروه های سنی در شبکه های اجتماعی با استفاده از یادگیری عمیق
عنوان انگلیسی مقاله:
Age Groups Classification in Social Network Using Deep Learning
کلمات کلیدی مقاله:
خدمات شبکه اجتماعی، تجزیه و تحلیل احساسات، یادگیری ماشین، تجزیه و تحلیل متن، شبکههای عصبی مصنوعی، شبکه عمیق
مناسب برای رشته های دانشگاهی زیر:
مهندسی کامپیوتر، فناوری اطلاعات
مناسب برای گرایش های دانشگاهی زیر:
هوش مصنوعی، اینترنت و شبکه های گسترده
وضعیت مقاله انگلیسی و ترجمه:
مقاله انگلیسی را میتوانید به صورت رایگان با فرمت PDF از باکس زیر دانلود نمایید. ترجمه این مقاله با فرمت WORD – DOC آماده خریداری و دانلود آنی میباشد.
فهرست مطالب:
چکیده
۱. مقدمه
۲. کارهای مشابه
A. ارتباط بین گروه سنی و ویژگیهای نوشتاری
B. تجزیه و تحلیل احساسات
C. یادگیری ماشین
۳. مدل پیشنهادی برای ردهبندی گروههایسنی
A. پردازش دادههای استخراج شده از شبکههای اجتماعی
B. فاز ردهبندی
4. استفاده از مدل پیشنهادی در معیار شدت احساسات
A. آزمونهای ذهنی در محیط آزمایشگاهی
B. آزمونهای ذهنی در نظارت شده از راه دور
5. نتایج
A. یادگیری ماشین برای مدل ردهبندی
B. بررسی سودمندی مدل ارائه شده در معیارهای شدت احساسات
6. بحث
7. نتیجه
منابع
قسمتی از مقاله انگلیسی و ترجمه آن:
ABSTRACT
Social networks have a large amount of data available, but often, people do not provide some of their personal data, such as age, gender, and other demographics. Although the sentiment analysis uses such data to develop useful applications in people’s daily lives, there are still failures in this type of analysis, either by the restricted number of words contained in the word dictionaries or because they do not consider the most diverse parameters that can influence the sentiments in a sentence; thus, more reliable results can be obtained, if the users profile information and their writing characteristics are considered. This research suggests that one of the most relevant parameter contained in the user profile is the age group, showing that there are typical behaviors among users of the same age group, specifically, when these users write about the same topic. A detailed analysis with 7000 sentences was performed to determine which characteristics are relevant, such as, the use of punctuation, number of characters, media sharing, topics, among others; and which ones can be disregarded for the age groups classification. Different learning machine algorithms are tested for the classification of the teenager and adult age group, and the deep convolutional neural network had the best performance, reaching a precision of 0.95 in the validation tests. Furthermore, in order to validate the usefulness of the proposed model for classifying age groups, it is implemented into the enhanced sentiment metric (eSM). In the performance validation, subjective tests are performed and the eSM with the proposed model reached a root mean square error and a Pearson correlation coefficient of 0.25 and 0.94, respectively, outperforming the eSM metric, when the age group information is not available.
چکیده
شبکههای اجتماعی دارای حجم زیادی از دادههای قابل دسترس هستند، اما افراد اغلب برخی از دادههای شخصی خود، از قبیل سن، جنسیت و سایر اطلاعات جمعیتشناختی را فراهم نمیکنند. اگرچه تجزیه و تحلیل احساسات، از چنین دادههایی برای توسعه برنامههای کاربردی مفیدی در زندگی روزمره افراد استفاده میکند، در این نوع تجزیه و تحلیل، یا به دلیل تعداد محدود کلمات مشمول در دیکشنریهای لغت یا به دلیل عدم ملاحظه متنوعترین پارامترهایی که میتوانند روی احساسات در جمله تاثیر بگذارند هنوز شکستهایی وجود دارد؛ بنابراین، اگر اطلاعات پروفایل کاربران و ویژگیهای نوشتن آنها را ملاحظه کنیم، میتوانیم نتایج قابل اطمینانتری را به دست آوریم. این تحقیق نشان میدهد که یکی از مهمترین پارامترهای مشمول در پروفایل کاربر، گره سنی است، که نشان دهنده این است که رفتارهای معمولی در میان کاربران گروه سنی یکسان وجود دارند، به ویژه زمانی که این کاربران درباره موضوعی یکسان مینویسند. تجزیه و تحلیل دقیقی با 7000 جمله برای تعیین این موضوع انجام شد که کدام ویژگیها، از قبیل استفاده از نشانهگذاری، تعداد کاراکترها، اشتراکگذاری رسانهها، موضوعات و غیره، مهم هستند؛ و کدام ویژگیها را میتوان برای ردهبندی گروههای سنی نادیده گرفت. الگوریتمهای مختلف یادگیری ماشین برای ردهبندی گروههای سنی نوجوان و بزرگسال آزمایش میشوند و شبکه عصبی پیچشی عمیق دارای بهترین عملکرد است به طوری که به دقت 95/0 در آزمایشهای معتبرسازی میرسد. علاوهبراین، به منظور اعتبارسنجی سودمندی مدل پیشنهادی، مفهوم سنجش شدت احساسات (eSM) اجرا شده است. در اعتبارسنجی کارایی، آزمونهای ذهنی انجام میشوند و مدل eSM با مدل پیشنهادی به میانگین مربع خطا و ضریب همبستگی پیرسون به ترتیب 0.25 و 0.94، بالاتر از متریک eSM دست یافت، درحالی که اطلاعات گروه سنی در دسترس نبودند.