طبقه بندی نیمه نظارتی ریزخوشه محور جریان داده - دانشکده فنی و مهندسی
طبقه بندی نیمه نظارتی ریزخوشه محور جریان داده
نوع: Type: پایان نامه
مقطع: Segment: کارشناسی ارشد
عنوان: Title: طبقه بندی نیمه نظارتی ریزخوشه محور جریان داده
ارائه دهنده: Provider: میثم معصومی
اساتید راهنما: Supervisors: دکتر مرتضی یوسف صنعتی
اساتید مشاور: Advisory Professors:
اساتید ممتحن یا داور: Examining professors or referees: دکتر محرم منصوری زاده - دکتر مهدی سخایی نیا
زمان و تاریخ ارائه: Time and date of presentation: 1400/10/22 14:00
مکان ارائه: Place of presentation: http://vc.basu.ac.ir/eng-thesis04/
چکیده: Abstract: در عصر حاضر، داده ها با سرعت و حجم بسیار زیادی به صورت بدون توقف و به شکل جریانداده در حال تولید هستند. یکی از روش-های کاربردی در کار با جریانداده، طبقه جریان ورودی است. از این رو در سال های اخیر روش های زیادی برای طبقه بندی جریانداده ارائه شده است. روش های موجود را از نقطه نظرهای مختلفی می توان مورد بررسی قرار داده و در دسته بندهای مختلفی قرار داد. در نخستین دید بررسی و دسته بندی روش های موجود بر اساس نوع الگوریتم یادگیری می باشد. در روش های طبقه بندی نظارتی جریانداده، جهت به روزرسانی الگوریتم نیاز به دسترسی به برچسب واقعی هر نمونه ورودی بعد از عمل طبقه بندی می باشد درحالیکه در دنیای واقعی دسترسی به برچسب واقعی داده ها امری زمان بر و دشوار است. از این روی روش های یادگیری نیمه نظارتی، عملکرد بهتری در کاربردهای دنیای واقعی ارائه می دهند. در دید دیگر دسته بندی روش های موجود براساس روش طبقه بند پایه می باشد، استفاده از طبقه بند KNN به همراه استفاده از روش های مبتنی بر ریزخوشه جهت ایجاد مرز تصمیم گیری به همراه خلاصه سازی داده ها یکی از روش های ساده و در عین حال کارآمد در طبقه بندی جریانداده می باشد. از سویی در دنیای واقعی، چالش اصلی ارائه دقت کافی با حفظ سرعت و حافظه اجرایی مناسب است. در روش پیشنهادی با اعمال رویکرد بسته محور به همراه استفاده از معیارهای مبتنی بر چگالی و استفاده از روش مبتنی بر خطا مرتبه زمانی روش پایه از مرتبه O({maxMC}^2) به مرتبه زمانی O(maxMClog(maxMC)) کاهش پیدا نمود. نتایج آزمایش مجموعه داده های دنیای واقعی حاکی از بهبود 47 درصدی زمان اجرایی روش پیشنهادی نسبت به روش پایه خویش دارد. میزان تغییرات دقت خروجی چشم گیر نبوده و به صورت میانگین میان تمامی مجموعه داده های مورد آزمایش حاکی از بهبود 0.97 درصدی نبست به روش پایه خویش دارد.
فایل: ّFile: تنزيل فایل