مقاله ترجمه شده درباره ترکیب شواهد در پردازش داده های پزشکی
مشخصات مقاله:
عنوان فارسی مقاله:
ترکیب شواهد در پردازش داده های پزشکی
عنوان انگلیسی مقاله:
Evidence Combination in Medical Data Mining
مناسب برای رشته های دانشگاهی زیر:
پزشکی
مناسب برای گرایش های دانشگاهی زیر:
انفورماتیک پزشکی
وضعیت مقاله انگلیسی و ترجمه:
مقاله انگلیسی را میتوانید به صورت رایگان با فرمت PDF از باکس زیر دانلود نمایید. ترجمه این مقاله با فرمت WORD – DOC آماده خریداری و دانلود آنی میباشد.
فهرست مطالب:
چکیده
1.مقدمه
2. پیشینه تئوری شاهد
3. محاسبه باورها با نزدیک ترین همسایه ها
4. محاسبه باورها با درخت تصمیم
5. ارزیابی عدم اطمینان
6. ارزیابی عملی
6.1 نتایج
7. کارهای مرتبط
8. نتیجه گیری
قسمتی از مقاله انگلیسی و ترجمه آن:
1. Introduction
Medical applications of data mining include prediction of the effectiveness of surgical procedures, medical tests and medications, and discovery of relationships among clinical and pathological data [1]. Clinical databases store large amounts of information about patients and their medical conditions. Data mining techniques applied on these databases discover relationships and patterns which are helpful in studying the progression and the management of diseases [1]. Evaluation may involve prediction or early diagnosis of a disease. In case of diseases like skin cancer, breast cancer and lung cancer early diagnosis is very important as it might help save a patient’s life. The aim of this work is to study and apply a formal evidence combination technique for mining medical data for prediction of or screening for a disease. Input data, consisting of feature vectors, is input to three different classifiers. The classifiers we used in this study are kNN (k nearest neighbor) [9], Bayesian [10] and Decision Tree classifiers [10]. Each classifier provides beliefs for each class. These pieces of evidence are then combined to reach a final diagnosis using Dempster’s belief combination formula [17]. The experiments are carried on the skin lesion (squamous disease [18]) and breast cancer data [14]. The approach proposed in this paper provides two desirable features: Robustness across multiple data sets with multiple classifiers and management of uncertainty in the presence of unequal error costs. The experiments are carried on dermatology and breast cancer data [14]. Testing is done by k-fold cross validation method with 25% of the data used exclusively as the test set.
1. مقدمه
موارد کاربردی پزشکی ِپردازش داده شامل موراد زیر میباشد: پیشبینی موثر بودن فرایندهای پزشکی، آزمایشهای پزشکی و دارویی و کشف روابط بین داده های کلینیکی و پاتولوژیک. دیتابیس های کلینیکی حجم زیادی از اطلاعات راجع به بیماران و شرایط پزشکیشان را ذخیره میکنند. تکنیک های پردازش داده که روی این دیتابیسها اجرا شده اند؛ روابط و طرح هایی را کشف میکنند که برای مطالعه پیشرفت و مدیرت بیماری ها مفید میباشند. ارزیابی ممکن است از پیش بینی یا تشخیص زودهنگام بیماری استفاده کند. در مورد بیماری هایی مانند سرطان پوست، سرطان سینه و سرطان ریه ، تشخیص زودهنگام آنها آنقدر مهم است که ممکن است به نجات جان بیمار بینجامد. هدف این کار، مطالعه و اجرای یک تکنیک ترکیب شاهد برای پردازش داده های پزشکی برای پیشبینی یا مشاهدهی یک بیماری است. داده های ورودی که شامل بردار های مشخصه هستند، به سه دستهکنندهی مختلف وارد میشوند. دسته کنندههایی که ما در این مطالعه استفاده کردهایم عبارتند از: دستهکنندههای kNN (kNN)، Naïve Bayesian و درخت تصمیم. هر دسته کننده باورهایی را برای هر کلاس بوجود می آورد. سپس این قسمت های شاهد برای تشخیص نهایی با استفاده از فرمول ترکیب باور دمپستر ترکیب میشوند. این آزمایشات روی داده های زخم پوست (بیماری فلسی) و سرطان سینه انجام میگیرند. رویکردی که در این مقاله ارائه شده است دو ویژگی مطبوع را بدست میدهد: توانایی در برابر مجموعههای چندگانه داده و دسته کنندههای چندگانه و مدیریت عدم اطمینان در حضور هزینههای خطای غیرمساوی. آزمایشات روی داده های درماتولوژی و سرطان سینه انجام گرفتند. آزمایش با روش ارزیابی k-fold cross صورت گرفته و 25% از داده ها بعنوان مجموعه ازمایشی استفاده شدند.