قالب : pdf
چکیده
این مقاله یک الگوریتم جدید به نام ID6NB را برای توسعه درخت تصمیم ، معرفی می کند که شامل
الگوریتم ID3 غیر افزایشی Quinlan است. این الگوریتم راه حل هایی برای دو مشکل ذیل ارائه
می کند: - وضعیتی که در آن رای گیری اکثریت تصمیم نادرست می دهد )یعنی ساخت دو نوع قانون
متفاوت برای داده یکسان(.
- کاهش ابعاد در الگوریتم غیر افزایشی درخت تصمیم گیری، تخمین صفت مناسب برای یک گره
جایی که دو یا چند صفت بهره اطلاعاتی یکسانی دارند. مشکل اکثریت به کمک الگوریتم Naive Bayes حل می شود. برای کاهش ابعاد نیز یک راه حل ارائه شده است. در نهایت، دقت طبقه بندی به
شدت بهبود یافته است. آزمایش گسترده و گسترش یافته در تعدادی از مجموعه داده های واقعی و
مصنوعی نشان می دهد که ID6NB یک الگوریتم دسته بندی state-of-the-art است که نسبت به
سایر روش های یادگیری درخت تصمیم گیری، خروجی بهتری دارد.
واژه های کلیدی: داده کاوی، کاهش ابعاد، طبقه بندی، درخت تصمیم، رای اکثریت،