میزکارWeka ، مجموعهای از الگوریتمهای روز یادگیری ماشینی و ابزارهای پیش پردازش دادهها میباشد. این نرمافزار به گونهای طراحی شده است که میتوان به سرعت، روشهای موجود را به صورت انعطافپذیری روی مجموعههای جدید داده، آزمایش نمود. این نرمافزار، پشتیبانیهای ارزشمندی را برای کل فرآیند داده کاوی های تجربی فراهم میکند. این پشتیبانیها، آماده سازی دادههای ورودی، ارزیابی آماری چارچوبهای یادگیری و نمایش گرافیکی دادههای ورودی و نتایج یادگیری را در بر میگیرند. همچنین، هماهنگ با دامنه وسیع الگوریتمهای یادگیری، این نرمافزار شامل ابزارهای متنوع پیش پردازش دادههاست. این جعبه ابزار متنوع و جامع، از طریق یک واسط متداول در دسترس است، به نحوی که کاربر میتواند روشهای متفاوت را در آن با یکدیگر مقایسه کند و روشهایی را که برای مسایل مدنظر مناسبتر هستند، تشخیص دهد.
نرمافزار Weka در دانشگاه Waikato واقع در نیوزلند توسعه یافته است و اسم آن از عبارت"Waikato Environment for knowledge Analysis" استخراج گشته است. همچنین Weka ، نام پرندهای با طبیعت جستجوگر است که پرواز نمیکند و در نیوزلند، یافت میشود.
شرح دیتاست (data set) پروژه:
پایگاه داده مذکور مربوط به اطلاعات 700 تن از مشتریان یک بانک می باشد که از بانک مذکور وام دریافت کرده اند و بانک مذکور این افراد را به لحاظ بازپرداخت اقساط خود به دو دسته مشتریان خوش حساب و بد حساب تقسیم کرده است. یکی از مهمترین مواردی که در بانک ها مد نظر است شناسایی مشتریان بد حساب و خوش حساب و جدا کردن این دو گروه از هم می باشد. تعداد رکوردهای این دیتا ست 700 رکورد می باشد که ابتدا به شرح فیلدهای این دیتا ست می پردازیم و کد گذاری این فیلدها را تشریح می کنیم. سپس مدل را
در نرم افزار فراخوانی می کنیم و پس از اعمال تغییرات و پیش پردازش لازم بروی فیلدها تکنیک های مورد نظر در حوزه های خوشه بندی، طبقه بندی و پیش بینی را بروی مدل اجرا می کنیم.