این پروژه داده های مربوط به حملات سایبری ناسا را با استفاده از الگوریتم بدون نظارت و خوشه بندی X-MEANS در نرم افزار داده کاوی رپیدماینر خوشه بندی میکند. همان طور که می دانید الگوریتم خوشه بندی X-MEANS تعدادی خوشه را به عنوان ورودی دریافت نموده و بر اساس تعداد خوشه های وارد شده(K) توسط کاربر,اقدام به خوشه بندی داده ها نموده و خروجی هایی را نمایش میدهد. الگوریتم خوشه بندی X-MEANS در نرم افزار داده کاوی رپیدماینر دارای کاربرد های فراوانی بوده و با توجه به سرعت بالایی که دارد, فرایند خوشه بندی داده های حملات سایبری ناسا را انجام خواهد داد.
بنابر این بطور کلی در این پروژه ابتدا مجموعه داده های حملات سایبری ناسا از طریق کنترل Read Excelبه مدل طراحی شده (الگوریتم خوشه بندی) وارد میشود. با توجه به اینکه ممکن است مقادیر داده های موجود دارای مقادیر پراکنده ای باشد,میبایست این داده ها نرمال شوند.
بدین منظور در این پروژه,از الگوریتم نرمال سازی خطی یا Normalization جهت نرمال کردن داده ها استفاده می گردد. بنابر این خروجی کنترل Read Excelبه ورودی کنترل Normalizeوارد شده و مقادیر موجود بین بازه [0,1] نرمال می شود.پس از این مرحله,خروجی این کنترل به الگوریتم خوشه بندی X-MEANS اعمال میشود. در این مرحله لازم است تعداد K که بیانگر تعداد خوشه ها جهت خوشه بندی داده ها توسط کاربر وارد شود. به صورت پیش فرض تعداد K=2 بوده که به منظور حفظ تعادل بین خوشه بندی,در این پروژه تعداد K=5 در نظر گرفته شده است. الگوریتم X-MEANS دارای دو خروجی مختلف می باشد.
یکی از خروجی های الگوریتم خوشه بندی X-MEANS اطلاعاتی در مورد خروجی و داده های خوشه بندی شده بوده و خروجی دیگر نیز نمونه ها را همراه با خوشه هایی تعلق داده شده را نشان میدهد. بنابراین باتوجه به این که نیاز است کاربر بداند که هرنمونه از داده ها چه برچسبی به آن اطلاق شده است,در اخرین مرحله از کنترل Write Excelجهت ذخیره سازی نتایج خوشه بندی استفاده خواهد شد. جهت اعمال تنظیمات این کنترل کافی است برروی این کنترل کلیک نموده و در پنجره سمت راست,ابتدا انواع فایل خروجی اعم از .xls یا xslx. را برگزیده و سپس ادرس ذخیره سازی داده ها را تنظیم خواهیم نمود. در نهایت لازم است,مدل خوشه بندی طراحی شده اجرا شود تا بتوان خروجی های مربوطه را مشاهده کنیم. بنابراین به اجرای شبیه سازی انجام شده ضمن مشاهده خروجی ها و نمودار های مختلف,میتوان در یک فایل اکسل جداگانه خوشه بندی صورت گرفته شده را مشاهده نمود. خروجی نهایی بدین صورت است که برای هر نمونه مشخص است که چه شماره خوشه ای به آن اختصاص داده شده است.
در صورت نیاز به تهیه پروژه های مشابه بر روی سایر داده ها و همچنین از طریق سایر الگوریتم های خوشه بندی کافیست یک تلگرام بر روی شماره تلفن پشتیبانی وب سایت ارسال گردد. در کمتراز10 دقیقه به پاسخ سوالات شما ارسال میگردد.