تولید خودکار توصیف تصویر با شبکه های عصبی عمیق - دانشکده فنی و مهندسی
تولید خودکار توصیف تصویر با شبکه های عصبی عمیق
نوع: Type: پایان نامه
مقطع: Segment: کارشناسی ارشد
عنوان: Title: تولید خودکار توصیف تصویر با شبکه های عصبی عمیق
ارائه دهنده: Provider: الهام حیدری
اساتید راهنما: Supervisors: دکتر میر حسین دزفولیان
اساتید مشاور: Advisory Professors: دکتر محرم منصوری زاده
اساتید ممتحن یا داور: Examining professors or referees: دکتر مهدی عباسی دکتر رضا محمدی
زمان و تاریخ ارائه: Time and date of presentation: شنبه 23/12/1399 ساعت 13
مکان ارائه: Place of presentation: http://vc.basu.ac.ir/eng-thesis04
چکیده: Abstract: در مسائل کاربردی بینایی ماشین و فهم زبان ، نمایش دقیق تصویر از اهمیت بالایی برخوردار است. بیشتر سیستمهای فعلی از ویژگیهای بصری و مفاهیم متنی بهعنوان طرح کلی از تصویر استفاده میکنند. بااینحال ، بازنماییهای کاملاً استنباطی معمولاً از این نظر نامطلوب هستند که از مؤلفههای جداگانهای تشکیلشدهاند و روابط بین آنها قابلمحاسبه نیست علاوه بر این نمیتوانند مفاهیم مهم تصویر را در توصیفات تولیدشده جای دهند . در این مقاله یک فرایند تکرارشونده جهت رسیدن به توصیف پیشنهادشده است . ما تصاویر ورودی را با مجموعهای از مناطق بصری و مفاهیم متنی متناظر که منعکسکننده مفاهیم معنایی خاص هستند، پردازش میکنیم . برای این منظور ، دو ماژول توجه را ایجاد میکنیم که به ترتیب با بهروزرسانی متقابل ، ویژگیهای بصری و مفاهیم متنی استخراجشده از تصویر را ادغام میکنند . خروجیِ دو ماژول قبل به مدل زبانی ارسالشده و این فرایند تکراری تا رسیدن به توصیف مطلوب ادامه مییابد . جهت انتخاب بهینة هایپرپارامترهای مدل ، از الگوریتم ژنتیک استفادهشده است . آزمایشها بر روی مجموعه دادة عظیم MS COCO انجام شده است . نتایج نشان میدهد که روش ما مؤثر است و بسیار سریع همگرا میشود . مدل پیشنهادی میتواند به طیف گستردهای از مدلها برای کاربردهای مربوط به تصویر و زبان تعمیم یابد.
فایل: ّFile: دانلود فایل