در این پروژه که با نرم افزار داده کاوی رپید ماینر تهیه شده است، عملیات طبقه بندی را با استفاده از درخت تصمیم یا الگوریتم decision tree انجام داده و ضمن رسم درخت نتایج را نیز نمایش می دهد. روال کار بدین صورت است که ابتدا با توجه به حجم داده های مربوط به پروتئینی که در اختیار داریم، 30% از داده ها را به عنوان داده های Test یا داده های ازمایشی در نظر گرفته و 70% از داده ها را نیز به عنوان داده های Train یا داده های آموزشی در نظر می گیریم. سپس ابتدا داده های train را به مدل مربوطه ایمپورت کرده و مدل تولید شده با درخت تصمیم را آموزش می دهیم. پس از اینکه مدل با توجه به داده های آموزشی، آموزش داده شده داده های test مه 30% از داده ها را تشکیل می دهد را حهت ارزیابی و جاسبه دقت به مدل نیز ایمپورت میکنیم. مدل آموزش دیده تک به تک نمونه ها را ارزیابی نموده و ضمن رسم درخت تصمیم تهیه شده بر اساس متد Information Gain نتایج طبقه بندی پروتئین ها و دقت روش را محاسبه نموده ونمایش می دهد.
بزودی آموزش های تصویری مرتبط به هر موضوع تهیه و در سایت قرار داده خواهد شد.