مقاله ترجمه شده درباره شبیه سازی برای آنالیز روش انتخاب ویژگی با استفاده از آنتولوژی ژنی برای طبقه بندی بیان ژن – سال 2013


مشخصات مقاله:


عنوان فارسی مقاله:

شبیه سازی برای آنالیز روش انتخاب ویژگی با استفاده از آنتولوژی ژنی برای طبقه بندی بیان ژن


عنوان انگلیسی مقاله:

A simulation to analyze feature selection methods utilizing gene ontology for gene expression classification


کلمات کلیدی مقاله:

داده کاوی، بیان ژن، طبقه بندی سرطان، آنتولوژی ژنی، شباهت معنایی، ارزیابی و انتخاب ویژگی


مناسب برای رشته های دانشگاهی زیر:

 زیست شناسی


مناسب برای گرایش های دانشگاهی زیر:

بیوانفورماتیک، میکروبیولوژی، ژنتیک و علوم سلولی و مولکولی


وضعیت مقاله انگلیسی و ترجمه:

مقاله انگلیسی را میتوانید به صورت رایگان با فرمت PDF از باکس زیر دانلود نمایید. ترجمه این مقاله با فرمت WORD – DOC آماده خریداری و دانلود آنی میباشد.


فهرست مطالب:

چکیده

محتوای اطلاعات و شباهت معنایی

روش ها

نتایج و بحث ها

خلاصه و نتایج


قسمتی از مقاله انگلیسی و ترجمه آن:

Abstract

Gene expression profile classification is a pivotal research domain assisting in the transformation from traditional to personalized medicine. A major challenge associated with gene expression data classification is the small number of samples relative to the large number of genes. To address this problem, researchers have devised various feature selection algorithms to reduce the number of genes. Recent studies have been experimenting with the use of semantic similarity between genes in Gene Ontology (GO) as a method to improve feature selection. While there are few studies that discuss how to use GO for feature selection, there is no simulation study that addresses when to use GO-based feature selection. To investigate this, we developed a novel simulation, which generates binary class datasets, where the differentially expressed genes between two classes have some underlying relationship in GO. This allows us to investigate the effects of various factors such as the relative connectedness of the underlying genes in GO, the mean magnitude of separation between differentially expressed genes denoted by d, and the number of training samples. Our simulation results suggest that the connectedness in GO of the differentially expressed genes for a biological condition is the primary factor for determining the efficacy of GObased feature selection. In particular, as the connectedness of differentially expressed genes increases, the classification accuracy improvement increases. To quantify this notion of connectedness, we defined a measure called Biological Condition Annotation Level BCAL(G), where G is a graph of differentially expressed genes.

چکیده

طبقه بندی مشخصات بیان ژنی یک دامنه ی تحقیقاتی اساسی است که میتواند برای روش های نوین انتقال دارو مورد استفاده قرار گیرد. یک چالش اصلی در رابطه با طبقه بندی داده های بیان ژنی تعداد کمک نمونه ها مرتبط با تعداد زیاد ژن ها است. برای حل این مشکل ، محققان الگوریتم های مختلف گزینش مشخصه را برای کاهش تعداد ژن ها پیشنهاد کرده اند. مطالعات اخیر با استفاده از شباهت معنایی بین ژن ها در آنتولوژی ژن ها (GO ) به عنوان روشی برای بهبود گزینش مشخصه ، آزمایش هایی را انجام داده اند. در حالی که تعداد کمی از مطالعات وجود دارد که به چگونگی استفاده از GO ها برای گزینش مشخصه میپردازد ، هیچ مطالعه ی شبیه سازی وجود ندارد که مشخص کند که چه زمانی میتواند از گزینش مشخصه ی GO استفاده کرد. برای بررسی این موضوع ، ما یک شبیه سازی جدید را توسعه دادیم ، که مجموعه داده های طبقه های باینری را ایجاد میکند که ژن هایی که به طور متفاوت بین دو طبقه بیان شده است در GO دارای رابطه هایی زیر لایه ای هستند. این امکان به وجود می آید تا تاثیر فاکتور های مختلف مانند همبندی های نسبی ژن های اصولی در GO ، مقدار میانگین جدایی بین ژن هایی که به طور متفاوت بیان شده اند که توسط نشان داده میشود ، و تعداد نمونه های تمرینی را مورد بررسی قرار داد. نتایج شبیه سازی ها ما بیان دارد که همبندی در GO میان ژن هایی که به طور متفاوت بیان شده است برای شرایط زیستی فاکتور اساسی برای تعیین کارایی گزینش مشخصه ی GO است. به طور خاص ، مادامی که همبندی ژن هایی که به طور متفاوت بیان شده است افزایش پیدا میکند ، بهبود صحت طبقه بندی ها نیز افزایش پیدا میکند. برای کمی سازی این مفهوم همبندی ، ما یک اندازه گیری به نام سطح تفسیر شرایط زیستی BCAL(G) را تعریف کردیم که G گراف ژن هایی است که به طور متفاوت بیان شده است.


 

دانلود رایگان مقاله انگلیسی

خرید ترجمه مقاله

دیدگاهتان را بنویسید