پروفایل استاد - دانشگاه بوعلی سینا همدان
Associate Professor
Update: 2024-11-21
Mansoorizadeh Muharram
Faculty of Engineering / Department of Computer Engineering
P.H.D dissertations
-
Multi-modal Fake News Recognition using Attention-based Ensemble of Deep Learners
2023Social networks have drastically changed how people obtain information. News in social net-works is accompanied by images and videos and thus receives more attention from readers as opposed to traditional ones. Unfortunately, fake news publishers often misuse these advantages to spread false information rapidly. Therefore, the early detection of fake news is crucial. The best way to address this issue is to design an automatic detector based on fake news content. So far, many fake news recognition systems including both traditional machine learning and deep learning models are proposed. Given that manual feature extraction methods are very time-consuming, deep learning methods are the preferred tools. This research aims to enhance the performance of existing approaches by utilizing an ensemble of deep learners based on attention mechanisms. To a great extent, the success of an ensemble model depends on the variety of its learners. To this end, we propose a novel loss function that enforces each learner to attend to different parts of news content on the one hand and obtain a good classification accuracy on the other hand. Also, the learners are built on a common deep feature extractor and only differ in their attention modules. As a result, the number of parameters is reduced efficiently, and the overfitting problem is addressed. Additionally, most research in automatic fake news detection is devoted to fully supervised setting. Given that the generation rate of news in social media is drastic and the labeling of a huge amount of data required by fully supervised models is expensive and time consuming, these models are not beneficial in real applications. To address this limitation, we extend our method for semi-supervised setting using effective augmentations, and a novel distribution-aware pseudo-labeling technique. The proposed augmentations enhance the robustness of learners and prevent overfitting effectively. Diverse learners are utilized to annotate the unlab
Thesis summary
-
مقايسه جامع روش هاي ايجاد توابع انتقالي و توسعه الگوريتم هاي جديد براي تخمين منحني نگهداشت آب خاك و منحني هدايت هيدروليكي خاك.
مصطفي راستگو 2020منحني نگهداشت آب خاك (SWRC ) و منحني هدايت هيدروليكي خاك (SHCC) به عنوان ويژگي هاي هيدروليكي خاك تأثير و نقش عمده اي در زمينه هاي هيدرولوژي، حفاظت محيط زيست، اكولوژي، پدولوژي و بسياري از زمينه هاي مرتبط با خاك دارند. با استفاده از اين ويژگي ها مي توان مدل هاي جريان آب و املاح، نفوذ، زهكشي و برنامه ريزي آبياري را تبيين و پيش بيني نمود. با اين وجود، اندازه گيري مستقيم ويژگي هاي هيدروليكي خاك در مزرعه و شرايط آزمايشگاه گران، وقت گير و خسته كننده است و گاهي اوقات اندازه گيري آن ها براي مقياس هاي بزرگ امكان پذير نيست. بنابراين، توابع انتقالي (PTFs) به عنوان روشي غيرمستقيم براي پيش بيني ويژگي هاي هيدروليكي خاك توسعه يافت. توابع انتقالي يكي از روش هاي غير مستقيم براي برآورد ويژگي هاي هيدروليكي خاك هستند كه با استفاده از روش هاي متعدد بين پارامترهاي دير يافت خاك مانند منحني نگهداري آب خاك و هدايت هيدروليكي و پارامترهاي زود يافت خاك مانند بافت، چگالي ظاهري و مقدار ماده آلي كه اندازه گيري آن ها آسان، سريع و كم هزينه است و در پژوهش هاي علوم خاك متداول اند، ارتباط برقرار مي كنند. اگرچه ايجاد PTFها در مقايسه با اندازه گيري مستقيم بسيار ساده مي باشد، اما انتخاب بهترين روش براي ايجاد PTF، مسئله اي است كه در اين زمينه وجود دارد. با توجه به بررسي كامل منابع مشاهده شد كه تا به حال مقايسه جامع الگوريتم هاي مختلف براي تخمين SWRC و SHCC انجام نشده است. به طوري كه در بسياري از موارد الگوريتم هاي مشابه در مقاله ها مورد بررسي قرار گرفته است و در مقابل الگوريتم هاي بسياري نيز وجود دارند كه مورد بررسي و مقايسه قرار نگرفته اند. همچنين هيچ تركيبي از الگوريتم هاي مختلف براي افزايش بهبود دقت تخمين صورت نپذيرفته است. در مطالعه حاضر، 28 روش شامل رگرسيون خطي چندگانه (MLR)، رگرسيون غيرخطي (NLR)، رگرسيون فرآيند گوسي (GPR) با تابع كواريانس نمايي (GPR_E)، رگرسيون فرآيند گوسي با تابع كواريانس ماترن (GPR_M)، مدل خطي تعميم يافته (GLM)، رگرسيون غيرخطي بر پايه چند جمله اي درجه سوم، شبكه عصبي پرسپترون چند لايه (MLP)، شبكه عصبي بيزين، شبكه عصبي پايه شعاعي (RBF)، شبكه عصبي مبتني بر ماشين يادگيري افراطي (ELM)، ماشين بردار پشتيبان (SVM) با تابع هاي هسته شعاعي (SVM_G)، چند جمله اي (SVM_P) و خطي (SVM_L)، روش مديري
-
توليد سيستم پرسش و پاسخ بصري با استفاده از تجميع روش هاي
مبتني بر تصويركاوي، پايگاه هاي دانش و يادگيري هوشمند
سميرا لويمي 2020چكيده : بينايي ماشين علمي براي ساخت سيستم هاي هوشمندي است كه هدف آنها آناليز، درك و استخراج اطلاعات مفيد از داده هاي بصري است. اين داده هاي بصري مي تواند تصاوير ساده، حجمي و توالي هاي ويدئويي باشد. پردازش زبان طبيعي، توانايي ماشين ها براي خواندن و درك زبان هاي انساني است. پرسش و پاسخ بصري يك مسئله تحقيقاتي هوش مصنوعي است كه مي توان آن را نقطه تقاطع يا تركيبي از پردازش زبان طبيعي، بينايي ماشين و استنتاج دانش دانست. در اين مسئله، به عنوان ورودي يك تصوير داده مي شود و سوالي در مورد آن پرسيده مي شود، و هدف يافتن پاسخ صحيح به سوال ورودي است. ار آنجا كه سوالات متنوعي در مورد تصوير پرسيده مي شود، سيستم به درك كاملي از تصوير، و مجموعه گسترده اي از قابليت-هاي هوش مصنوعي نياز دارد، مانند تشخيص شي، تشخيص رويداد و استدلال مبتني بر دانش. با توجه به عملكرد قابل توجه شبكه هاي عصبي عميق و عملگرهاي پركاربرد كلاسيك استخراج ويژگي از تصاوير، روش هاي پيشين نيز از اين روش ها براي حل اين مسئله استفاده كرده اند كه هريك نقاط ضعف و قوت مخصوص به خود را دارند. همچنين نكته ي ديگر قابل توجه در طراحي سيستم پرسش و پاسخ بصري، حوزه ي هدف براي استفاده از اين سيستم مي باشد. در حوزه هاي تخصصي مانند پزشكي كه با مسائل حياتي انسان سروكار دارند، علاوه بر تنوع و گستردگي سوالات، دقت بالاي سيستم در پاسخ دهي بسيار مهم است. در اين پژوهش، يك معماري جديد براي توليد مدل هاي پرسش و پاسخ بصري ارائه مي دهيم كه بيشتر از زبان مبتني بر آناليز داده هاي بصري است. همچنين، هدايت مراحل آناليز تصوير به طور مستقيم براساس پرسش مطرح شده انجام مي شود، تا بتوان در حوزه هاي تخصصي نيز متناسب با هر سوال مطرح شده مدلسازي را به گونه اي انجام داد كه بهترين مدل براي پيش بيني پاسخ آن سوال توليد كند. معماري پيشنهادي كه مبتني بر تكنيك توجه است، داراي دو بخش كلي شامل، استخراج ويژگي از تصاوير مبتني بر نوع سوال مطرح شده و پيش بيني پاسخ مي باشد. در اين راستا هفت ماژول پيشنهادي براي پاسخ به سوالات مطرح شده در مورد تصاوير ساده و حجمي، ارائه شده است. در اين ماژول ها متناسب با سوال مطرح شده يكي از روش هاي استخراج ويژگي هاي عميق (شامل استفاده از شبكه هاي عصبي كانولوشنال، موبايل نت و حافظه كوتاه مدت طولاني) يا روش هاي كلاسيك (شامل عملگرهاي معروف كلاس
Thesis summary
-
تشخيص تعامل انسان در ويديو با استفاده از شبكه هاي عصبي عميق
مه لقا افراسيابي 2019چكيده: بسياري از ويديوهايي كه انسان ها را به تصوير مي كشد، داراي فعاليت هايي است كه بين انسان ها وجود دارد و نشان گر فرهنگ و رابطه بين آن هاست. با پيشرفت تشخيص كنش هاي انسان در ويديو، محققان به شناخت و پيش بيني تعامل انسان- انسان به طور خودكار پرداخته اند. هدف از پيش بيني تعامل تشخيص زود هنگام تعامل قبل از انجام كامل آن است. كه در بازيابي ويديو بر اساس محتوا، تعامل انسان و كامپيوتر و امنيت و نظارت كاربرد دارد. اما اين موضوع هنوز يك مسئله چالش برانگيز است، كه اين چالش مي تواند ناشي ازتغييرات تصوير، نحوه اجراي متفاوت افراد در انجام يك تعامل و .. باشد. روش هاي موجود در اين حوزه بر اساس ويژگي به ويژگي هاي دستي و ويژگي هاي يادگرفته شده تقسيم مي شوند. ويژگي هاي ياد گرفته شده تا حدودي چالش هاي تنظيمات ضبط، ظاهر فرد، اندازه تصوير و نقطه ديد را كاهش داده اند. انتظار ما اين است كه استفاده از استخراج ويژگي يادگرفته شده در مدل هاي پيشنهادي مي تواند چالش ها را تا حد امكان كاهش دهد. در اولين مدل پيشنهادي به نام Dual-Actor CNN از دو شبكه همسان براي استخراج ويژگي هاي دو فرد در حال تعامل استفاده شده است. كه اين مدل به علت استفاده از شبكه هاي همسان و به اشتراك گذاري وزن ها باعث مي شود چالش جهت و نقطه ديد انجام كنش حل شود. در روش پيشنهادي ديگر مسئله در قالب سري زماني به نام DTW-CNN مدل مي شود، فرض بر اين است كه استفاده از روش روش پيچ وتاب زماني پويا بتواند بر چالش نرخ زمان اجراي تعامل غلبه كند. از آنجايي كه انجام هر كنش يا تعامل ماهيتي فازي دارد و نمي-توان حركت مشخصي براي تعريف آن در نظر گرفت، استفاده از روش فازي مي تواند باعث افزايش دقت تشخيص تعامل شود، در مدل پيشنهادي Fuzzy-Relation CNN از حركات افراد در ويديو دو تصوير فازي ساخته مي شود كه شامل حركات افراد در حال تعامل است. اين تصاوير ايجاد شده اطلاعات پيش-زمينه و نا مرتبط به تعامل را حذف مي كند و تغييرات مهم حركت افراد را با توجه به زمان آن را نگه ميدارد. سپس از تصوير ايجاد شده ويژگي استخراج مي شود. سه مدل بر روي مجموعه داده هاي TV human interaction، BIT و UT ارزيابي شده اند. نتايج نشان مي دهد كه دقت اين مدل ها براي پيش-بيني تعامل نسبت به روش هاي پيشين بالاتر بوده و در بين اين سه مدل روش Dual-Actor دقت بالاتري داشته است.
Thesis summary
Master Theses
-
شبكه عصبي عميق با معماري معنايي-احساسي براي تشخيص احساس در متن با استفاده از جاسازي واژه هاي از پيش آموزش ديده
فائزه اسدبيگي 2024تشخيص احساسات از متن به سبب نياز سازمان ها و مراجع به اطلاعات موجود در داده هاي مكتوب از اهميت بالايي برخوردار است. پژوهش ها نشان داده است كه به علت وجود كلمات و عبارات عاميانه و يا خارج از دايره واژگاني و نيز بُعد پيچيده و متنوع بيان مكتوب احساسات در افراد مختلف، شبكه هاي عصبي عميق در ثبت الگوها و بازنمايي هاي پيچيده عملكرد بهتري نسبت به ديگر روش هاي موجود از خود نشان داده اند. در اين پژوهش، يك شبكه عصبي عميق به نام معماري معنايي-احساسي با استفاده از برچسب گذاري اجزاي كلام براي تشخيص احساسات در متن، با استفاده از جاسازي واژه هاي از پيش آموزش ديده پيشنهاد شده است. اين مدل اطلاعات معنايي و اطلاعات احساسي موجود در متن را با توجه به نقش گرامري كلمات در جمله، باهم ادغام مي كند تا معنا و احساس در متن را به خوبي به تصوير بكشد. از جاسازي هاي كلمات از پيش آموزش ديده، براي نمايش برداري كلمات استفاده شده است. اين بردارها اطلاعات معنايي غني را رمزگذاري مي كنند و مدل را قادر مي سازند تا زمينه و معناي كلمات را به طور مؤثرتر دريافت كند. معماري پيشنهادي از سه زيرلايه تشكيل شده است. اولين زيرشبكه از شبكه BiLSTM براي گرفتن اطلاعات متني و تمركز بر روابط معنايي استفاده مي كند. دومين زيرشبكه از شبكه CNN براي استخراج ويژگي هاي احساسي استفاده مي كند. اين زيرشبكه روابط عاطفي بين كلمات را نيز درنظر مي گيرد. سومين زيرشبكه از شبكه CNN و يك بلوك POS tagging براي استخراج ويژگي هاي بيشتر با توجه به نقش كلمات جمله، استفاده مي كند. روش پيشنهادي بر روي مجموعه داده ISEAR اعمال و آزموده شده است. نتايج بدست آمده از آزمايش روش پيشنهادي بر روي مجموعه داده و مقايسه آن با روش هاي پيشين نشان مي دهد كه مدل عملكرد مطلوبي داشته و به نتايج قابل قبولي دست يافته است.
Thesis summary
-
انتخاب ويژگي براي طبقه بندي با استفاده از محاسبات تكاملي
مهسا بوجاري 2024در بسياري از مسائل يادگيري ماشين تعداد زيادي ويژگي وجود دارد كه همه اين ويژگي ها ضروري نيستند؛ زيرا بسياري از آنها اضافي يا حتي نامربوط هستند كه ممكن است عملكرد يك الگوريتم طبقه بندي را كاهش دهند. هدف از انتخاب ويژگي، حل اين مشكل با انتخاب تنها زيرمجموعه كوچكي از ويژگي هاي مرتبط از مجموعه ويژگي بزرگ اصلي است. با حذف ويژگي هاي نامربوط و زائد، انتخاب ويژگي مي تواند ابعاد داده ها را كاهش دهد، روند يادگيري را تسريع كند، مدل آموخته شده را ساده سازي كند و يا كارايي را افزايش دهد. انتخاب ويژگي به دليل دارا بودن فضاي جستجوي بزرگ، كار دشواري است. از بين روش هاي مختلف موجود براي انتخاب ويژگي، روش هاي محاسبات تكاملي به دليل توانايي يا پتانسيل جستجوي سراسري خود براي حل مسئله انتخاب ويژگي در سال هاي اخير توجه زيادي را به خود جلب كرده اند. هدف اين پژوهش، بهبود دقت طبقه بندي در مسائل مساله انتخاب ويژگي با استفاده از الگوريتم هاي تكاملي است. مهم ترين چالش هاي مسئله انتخاب ويژگي، مقياس پذيري، هزينه محاسباتي، روش هاي جستجو، معيار ارزيابي و تعداد نمونه ها است. در اين پژوهش براي كاهش هزينه محاسباتي به ويژه در مقياس بزرگ از روشي براي تركيب انتخاب ويژگي و انتخاب نمونه استفاده شده است و اين روش به عنوان روش پايه در همه آزمايش ها استفاده شده است. براي بهبود دقت طبقه بندي از تركيب روش پايه با الگوريتم هاي تكاملي مختلف به عنوان روش جستجو استفاده شده است و از 13 مجموعه داده براي ارزيابي روش پيشنهادي استفاده شده است. پس از اجراي آزمايش هاي مختلف دقت طبقه بندي نسبت به روش پايه در همه 13 بهبود داده شده است.
Thesis summary
-
طبقه بندي تصاوير سي تي اسكن كبد به كمك روشهاي يادگيري نيمه نظارتي عميق
2024كبد يك عضو مهم و حياتي در بدن مهره داران است و سلامت كبد براي حفظ سلامتي كل بدن ضروري است. تشخيص و طبقه بندي ضايعات كانوني كبد از تصاوير سي تي اسكن، به دليل اهميت كبد در بدن انسان، چالشي بسيار مهم براي پزشكان است. اين پژوهش با هدف بهبود دقت طبقه بندي كبد سالم و ضايعات كانوني كبد از جمله كيست ، هيپرپلازي ندولار كانوني ، كارسينوم سلولي كبد و همانژيوم ايجاد شده است و از شبكه هاي عصبي عميق و يادگيري انتقالي استفاده كرده ايم. در اين پژوهش، از سه شبكه عصبي عميق ResNet، AlexNet و EfficientNet براي طبقه بندي تصاوير سي تي اسكن كبد با كنتراست بهبوديافته از سه مداليته مختلف NC، ART و PV استفاده شده است. به دليل تعداد محدود تصاوير سي تي اسكن كبد، از يادگيري انتقالي براي بهبود عملكرد مدل ها استفاده كرده ايم.در اين پژوهش از دو نوع تابع اتلاف ميانگين مربعات خطا و تابع اتلاف متقاطع آنتروپي استفاده كرده ايم. نتايج ارزيابي نشان مي دهد كه مدل ResNet با يادگيري انتقالي و تابع اتلاف متقاطع آنتروپي، بهترين عملكرد را در مقايسه با ساير مدل ها و روش هاي پيشرفته ديگر دارد و مقايسه ي آن با پژوهش هاي مشابه نشان دهنده نتايج مطلوب و قابل قبولي در حوزه قطعه بندي ضايعات كانوني كبد است. اين پژوهش نشان مي دهد كه استفاده از شبكه هاي عصبي عميق و يادگيري انتقالي مي تواند دقت طبقه بندي ضايعات كانوني كبد را از تصاوير سي تي اسكن به طور قابل توجهي افزايش دهد.
Thesis summary
-
جمعيت شماري ويدئويي با استفاده از شبكه هاي عصبي عميق توسعه يافته
2024اخيراً، شمارش تعداد افراد براي صحنه هاي ويدئويي پر ازدحام به دليل كاربردهاي گسترده آن (مانند نظارت تصويري، امنيت عمومي و تحليل محتواي چندرسانه اي) با استفاده از روش هاي مبتني بر يادگيري عميق مورد توجه قرارگرفته است. عمده روش ها روي تصاوير ثابت تمركز داشته اند و تعداد بسيار كمتري بر روي شمارش جمعيت مبتني بر ويدئو تمركز مي كنند. با اين وجود اين مدل ها به دليل عدم توجه به همبستگي زماني، داده هاي محدود، محيط متغير، انسداد و ساير موارد قابليت تعميم و كارايي مناسب براي صحنه هاي طبيعي را ندارند ضمن اينكه ممكن است به دليل كمبود و عدم تنوع داده دچار بيش برازش هم باشند. اين پژوهش، نشان مي دهد تخمين جريان افراد در مكان هاي تصوير بين تصاوير متوالي و استنتاج تراكم افراد از اين جريان ها بدون نياز به معماري پيچيده تر، عملكرد را به طور قابل توجهي افزايش مي دهد. علاوه بر اين، افزودن يك شبكه عصبي توجه مكاني-زماني براي تخمين تعداد عابران پياده نيز بررسي شده است.
Thesis summary
-
ارائه يك روش كارآمد براي تشخيص و تحليل بدافزارهاي اندرويد با يادگيري ماشين
آرزو ياوري يگانگي 2023چكيده: با افزايش استفاده از دستگاه هاي تلفن همراه، حمله ي بدافزارها به خصوص در تلفن هاي اندرويدي كه سهم زيادي از بازار را به خود اختصاص مي دهند، افزايش مي يابد. هكرها سعي مي كنند با روش هاي مختلف مانند سرقت اعتبار، نظارت و تبليغ هاي مخرب به تلفن هاي هوشمند حمله كنند. ازاين رو راهكارهاي بسيار زيادي براي كشف اين بدافزارها به وجود آمده است كه با استفاده از تحليل ايستاي كدهاي برنامه ها و بررسي مجوز هاي داده شده و يا تحليل پويا و اجراي برنامه ها و بررسي رفتار برنامه و يا تركيبي از اين دو روش مي توان بدافزارها را شناسايي كرد و مشخصه هاي اصلي برنامه ها را موردبررسي قرارداد. در ميان اقدامات متقابل متعدد، روش هاي مبتني بر يادگيري ماشين به عنوان وسيله اي مؤثر براي تشخيص اين حمله-ها شناخته شده است، زيرا آن ها مي توانند مجموعه اي از مثال هاي آموزشي را طبقه بندي كنند. در اين پايان نامه، از يك مجموعه داده داراي 5560 بدافزار و 123453برنامه كاربردي سالم استفاده شده است، از بين 5560 بدافزار، ده بار به صورت تصادفي 100 بدافزار انتخاب شده اند و از بين123453 برنامه كاربردي سالم، به دليل تعداد زياد اين برنامه هاي كاربردي، 2201 برنامه كاربردي به صورت ثابت انتخاب شدند. سپس ويژگي هاي هريك از اين مجموعه 100تايي بدافزارها و 2201 برنامه كاربردي سالم استخراج مي شوند. پس ازآن اين ويژگي ها به الگوريتم هاي يادگيري ماشين داده مي شوند، تا بين بدافزارها و برنامه هاي كاربردي سالم تمايز قائل شود. در اين پژوهش علاوه بر ويژگي هاي استخراج شده در پژوهش هاي قبلي ويژگي هاي بيشتري استخراج مي شوند. هم چنين از الگوريتم هاي مختلف يادگيري ماشين استفاده مي شود. نتايج نشان مي دهد اضافه كردن ويژگي هاي بيشتر، در نتايج نهايي برخي از الگوريتم هاي يادگيري ماشين تأثير مثبتي دارد. هم چنين از بين الگوريتم هاي مختلف يادگيري ماشين، الگوريتم جنگل تصادفي بهترين عملكرد را دارد.
Thesis summary
-
مدلسازي و حل مساله امداد و آواربرداري زلزله با دسته بندي مصدومان و تيم هاي پزشكي و استفاده از سگ هاي زنده ياب
فاطمه خيلدار 2023 -
استخراج ويژگي هاي آموزشي اساتيد برتر از منظر ارزيابي دانشجويان مبتني بر تكنيك هاي داده كاوي در كانواس
زيبا زارعي 2023توسعه ي فناوري اطلاعات باعث پديدار شدن مفاهيم نوآورانه اي در حوزه هاي متنوع شده است و آموزش الكترونيكي يكي از نتايج مثبت اين تحولات است. امروزه، بسياري از مؤسسات آموزش عالي در سراسر جهان از سيستم هاي مديريت يادگيري آنلاين به منظور آموزش بهره مي برند. اين سيستم ها امكان تعامل مستقيم اساتيد و دانشجويان را فراهم مي كنند و همه ي فعاليت هاي آنان در اين سيستم ها به طور جامع ثبت مي شود. داده هاي مرتبط با ثبت وقايع در اين سيستم هاي مديريت يادگيري الكترونيك اغلب حاوي اطلاعات مفيدي در دوره هاي آموزشي مختلف مي باشند. با توجه به حجم عظيم اين داده ها، انجام كاوش در آن ها به منظور تجزيه و تحليل الگوهاي رفتاري اساتيد امري ضروري است و از طريق علم داده كاوي مي توان عملكرد اساتيد را به دقت تجزيه و تحليل نمود. فرآيند داده كاوي با استفاده از تكنيك هاي گوناگون اطلاعات مفيد را از داده ها بيرون مي كشد. يكي از كاربردهاي مهم داده كاوي، پيش بيني مي باشد كه تكنيك درخت تصميم يكي از الگوريتم هاي مهم اين حوزه به شمار مي رود و از آنجايي كه يكي از اركان اساسي پيشرفت علمي و پژوهشي هر واحد آموزشي از عملكرد و انگيزه اساتيد آن نشأت مي گيرد، بررسي عملكرد اساتيد دانشگاه بوعلي سينا همدان و تحليل نتايج به دست آمده مي تواند باعث ارائه مدل پيشرفت به اساتيد گردد. روش اين پژوهش از نظر نوع انجام پژوهش، به طور توصيفي-تحليلي و از لحاظ هدف كاربردي است. فرآيند استخراج داده ها بر اساس متدلوژي استاندارد كريسپ-دي ام بنا شده است؛ بعد از انجام مراحل اين روش داده ها در نرم افزار وكا بررسي شدند و درخت تصميم ترسيم شد. در ادامه براي به دست آوردن اطلاعاتي در مورد ويژگي هاي اساتيد و تفاوت بين دو گروه اساتيد بالا و پايين و نتيجه گيري نهايي استفاده از اطلاعات آماري نيز ضروري بود. در پژوهش حاضر جامعه ي آماري، همه ي اساتيد دانشگاه بوعلي سينا همدان در سال تحصيلي 1401-1400 بودند كه بر اساس آمار اداره ي ارزيابي و نظارت دانشگاه تعداد آن ها 811 نفر بود. حجم نمونه شامل 108 نفر از اساتيد از همه گروه هاي آموزشي به همراه اطلاعات تمامي دروس اساتيد ذكر شده بودند كه در 390 ركورد ثبت شده اند. اين پژوهش به شيوه ي هدفمند و در دسترس در دو گروه 54 نفره كه به دو گروه بالا و پايين از اساتيد تقسيم بندي شده اند، انجام گرفت. نتايج پژوهش نشان داد كه ا
Thesis summary
-
قطعه بندي اسبك مغزي در تصاوير تشديد مغناطيسي با استفاده از شبكه هاي عصبي عميق
عليرضا صادقي 2023اسبك مغز يك ساختار مغزي كوچك، مياني و زير قشري است كه به حافظه بلند مدت و كوتاه مدت مربوط مي شود. شكل و شمايل اسبك مغزي تحت تاثير مواردي همچون زوال عصبي يا آلزايمر مي تواند تغيير پيدا كند. قطعه بندي اسبك مغزي از تصوير تشديد مغناطيسي براي تحقيقات اختلالات عصبي- روانپزشكي از اهميت بالايي برخوردار است و همچنين مي تواند در بررسي بيماري هايي مانند آلزايمر، صرع و اسكيزوفرني استفاده شود. يكي از ضرورت هاي بررسي و تحليل تصوير اسبك مغزي، همانطور كه گفته شد، پيش بيني احتمال ابتلا به آلزايمر مي باشد، در صورتي كه اين بيماري سريع تشخيص داده شود و روند درمان آن در مراحل ابتدايي صورت بگيرد احتمال بهبود آن بيشتر است و احتمال كارآمد بودن روش هاي درماني نيز بيشتر خواهد بود. هزينه هاي زياد مربوط به قطعه بندي دستي اسبك مغزي باعث شده است كه پژوهش هايي در حوزه قطعه بندي خودكار اسبك مغزي از تصاوير پزشكي انجام شود. يكي از مهم ترين چالشهاي سر راه براي جداسازي اسبك مغزي در تصاوير پزشكي كوچك بودن محدوده ي آن مي باشد بطوري كه تشخيص ناحيه قرارگيري اسبك مغز در تصاوير پزشكي با چشم غير مسلح دشوار است. هدف اين پژوهش ارائه ي مدلي براي قطعه بندي و تعيين مرز دقيق قرارگيري اسبك مغز در تصاوير تشديد مغناطيسي است. امروزه يادگيري عميق در بينايي رايانه داراي نقشي كليدي بوده و براي اهداف گوناگوني چون بازشناسي تصوير، تشخيص چهره، قطعه بندي و تقسيم بندي تصاوير پزشكي و... به كار مي رود. در اين پژوهش مدلي جمعي از يادگيري عميق با بهره گيري از ماسك فازي از پيش آموزش ديده براي قطعه بندي اسبك مغز ارائه شده است. براي افزايش دقت مدل در اين پژوهش يك ماسك فازي با استفاده از مدل شبكه عصبي كانولوشني ايجاد مي شود. استفاده از ماسك فازي از پيش آموزش ديده با حذف قسمت هاي اضافه تصوير تشديد مغناطيسي مي تواندپيچيدگي مدل جمعي نهايي را كاهش دهد و موجب افزايش دقت در قطعه بندي اسبك مغز شود. بعد از ماسك كردن تصاوير از يك مدل جمعي متشكل از شبكه هاي عصبي كانولوشني براي قطعه بندي اسبك مغز استفاده مي شود. مدل نهايي ارائه شده قادر است با دريافت يك تصوير تشديد مغناطيسي از مغز در صورت مشخص بودن اسبك مغز آن را با دقت قابل توجهي شناسايي كند. در ادامه بعد از ايجاد مدل با بخشي از داده هاي موجود در ديتاست، اقدام به ارزيابي مدل شد. نتيجه ارزيابي ان
Thesis summary
-
يادگيري با نمونه هاي محدود به كمك روش هاي مبتني بر پيام واره
2023امروزه، در پردازش زبان طبيعي، داده هاي برچسب گذاري شده مهم است، بااينحال، يافتن تعداد كافي از داده ها يك مرحله چالشبرانگيز است. بسياري از وظايف وجود دارد كه بهسختي مي ميتوان دادههاي آموزشي موردنياز را به دست آورد. براي مثال در ترجمه ماشيني بايد دادههاي زيادي را به زبان مقصد آماده كنيم تا عملكرد نهايي قابلقبول باشد؛ بااينحال، ممكن است نتوانيم دادههاي مفيد را در زبان مقصد جمعآوري كنيم. ازاينرو، نياز است از يادگيري با نمونه هاي محدود استفاده كنيم. اخيراً روشي به نام پيام واره نويسي معرفي شده است كه در آن ورودي هاي متن با استفاده از فرمت خاصي كه يك يا چند جاي خالي دارد، به متني با ساختار جديد تبديل مي شود. با توجه به متن جديد داراي جاي خالي، يك مدل زباني پيش آموزشديده بهترين كلمه را جايگزين جاي خالي مي كند. پيام واره مي تواند در زمينه يادگيري با نمونه ها هاي محدود به ما كمك كند. حتي در مواردي كه دادهاي وجود ندارد كه به يادگيري بدون نمونه معروف است. در كارهاي اخير از مدل هاي زباني بزرگ مانند GPT-2 و GPT-3 استفاده و با روش پيام واره نويسي، كارهايي مانند ترجمه ماشيني انجام مي شود. در اين تلاشها از هيچ داده آموزشي برچسب داري استفاده نمي كنند؛ بااين حال اين نوع مدلها با تعداد زيادي پارامتر به سختافزار قدرتمندي نياز دارند. در اين پژوهش، روشي مبتني بر پيام واره نويسي براي يادگيري با نمونه ها هاي محدود معرفي شده است. روش ارائه شده بر پايه ساختار PET ايجاد شده است. PET با استفاده از مدل ها هاي زباني كوچك مثل RoBERTa يادگيري با نمونه ها هاي محدود را با عملكرد قابلقبولي انجام مي دهد. بر اساس نتايج به دست آمده، روش ارائه شده با استفاده از PET و مهندسي پيام واره و مهندسي پاسخ و همچنين انجام پردازشهاي مختلف در دادههاي متني به نتايج قابلقبولي دستيافته است.
Thesis summary
-
يك چارچوب كاري براي توليد پيشنهادهاي قابل توضيح با استفاده از يادگيري چند وظيفه اي
محمدمبين شهيدي 2023به طور خلاصه، سيستم پيشنهادگر يك سيستم هوشمند بازيابي اطلاعات است كه بر اساس بازخورد هاي كاربر در گذشته (مثلا نمرات، امتيازات يا لايك ها) فهرستي از پيشنهاد ها (مثلا فيلم ها يا كتابها) كه كاربر احتمالا به آن ها علاقه مند است را پيش بيني مي كند. همچنين در زمينه ي پژوهشي پيشنهاد شخصي سازي شده، نوعي از پيشنهاد به نام پيشنهاد توضيح پذير وجود دارد كه پاسخگوي اين پرسش است كه چرا يك محصول خاص به كاربر پيشنهاد شده است؛ يعني با ذكر شدن توضيحاتي براي پيشنهاد ها هدف سيستم از ارائه آن ها روشن مي شود. توضيح پذيري پيشنهادها شفافيت سيستم را بهبود مي دهد و به كاربران در انتخاب و تصميم گيري ميان كالاهاكمك مي كند. به طور كلي پيشنهاد توضيح پذير شفافيت، اقناع، كارآمدي، اعتماد، اعتبار و در ادامه رضايت مشتريان را بهبود مي دهد. يكي از رويكرد هاي اصلي پيشنهاد رويكرد پالايش اشتراكي است كه بر اساس تعاملات قبلي بين كاربران و كالاها (مثلا امتيازات) علاقه ي كاربران در آينده را پيش بيني مي كند. عموما امتيازات كاربران به كالا ها در يك ماتريس دو بعدي به نام ماتريس كاربرد ثبت مي شود كه كاربران و كالاها ابعاد آن را تشكيل مي دهند. به طور خلاصه اين رويكرد بر اساس امتيازات ثبت شده و با كمك مقايسه و شباهت يابي ميان كاربران و كالاها، امتيازات ثبت نشده عناصر خالي ماتريس كاربرد را پيش بيني مي كند. اولين چالشي كه در رويكرد پالايش اشتراكي وجود دارد، چالش خلوت بودن ماتريس امتيازات (محدوديت داده) است زيرا همه ي كاربران به همه ي كالاها نمره نداده اند. در كنار اين چالش، چالش عدم شفافيت در نتايج سيستم پيشنهادگر هم وجود دارد. اين مشكل اساسا ازعدم ارائه دلايل براي چرايي فهرست پيشنهاد ها ناشي مي شود. براي غلبه بر اين چالش ها ايده ي استفاده از نظرات كاربران مطرح شد، پژوهشگران اين حوزه به تازگي از نظرات كاربران به عنوان داده هاي كمكي براي رفع چالش كمبود داده بهره مي گيرند. واضح است كه نظرات كاربران مانند امتيازات دربرگيرنده ي ترجيحات آن ها نسبت به كالاها مي باشد با اين تفاوت كه نظرات كاربران، بر خلاف امتيازات آن ها كه فقط بيانگر ترجيحات كلي كاربران نسبت به كالاها است، با جزئيات دقيق تري ترجيحات كاربران نسبت به ويژگي هاي مختلف كالاها را توصيف مي كنند. همچنين امروزه، توليد متن ماشيني يكي از موضوعات موردتوجه محققان در حوز
Thesis summary
-
پيش بيني سري هاي زماني مالي و آناليز شبكه هاي اجتماعي
به وسيله ي شبكه هاي عصبي عميق
اصف پورحسيني 2022پيش بيني قيمت بيت كوين به عنوان يكي از چالش هاي حوزه ي مالي و رمزارز است. تحقيق در زمينه مدل هاي پيش بيني قيمت در بازارهاي مالي عليرغم چالش هاي فراواني كه در بر دارد همچنان يكي از حوزه هاي فعال جهت تحقيقات مي باشد. قيمت رمزارزها غيرخطي، پويا و داراي بي نظمي است. بنابراين، تشكيل سري هاي زماني مالي و پيش بيني آن ها بسيار دشوار است. اخيرا بسياري از تحقيقات نشان داده اند كه بررسي توييت هاي منتشر شده پيرامون رمزارزها مي تواند دقت مدل هاي پيش بيني را بهبود بخشد. در ميان جديدترين تكنيك هاي موجود جهت پيش بيني قيمت رمزارز، مي توان به مدل هاي يادگيري عميق اشاره كرد كه با توجه به قابليت بالا در شناخت الگوهاي پيچيده در حوزه هاي مختلف، جزء موضوعاتي هستند كه حجم بالايي از تحقيقات را به خود اختصاص داده اند. در اين پژوهش با تركيب سري هاي زماني با توييت هاي پيرامون بيت كوين، كه اساساً دو نوع داده اي متفاوت هستند مدلي را ارائه خواهيم داد كه مي تواند تاثير توييت ها را بر قيمت اين رمزارز نشان دهد. براي سري هاي زماني از شاخص هاي مالي مهمي چون قيمت بيت كوين، قيمت نفت خام، قيمت طلا و ... و براي توييت هاي مربوط به بيت كوين نيز از الگوريتم FinBERT براي استخراج ويژگي استفاده شده است. در اين پژوهش نشان مي دهيم كه تركيب سري زماني بيت كوين و ساير شاخص هاي مالي با ويژگي هاي استخراج شده از الگوريتم FinBERT مي تواند تأثير بسزايي بر روي پيش بيني قيمت بيت كوين داشته باشد.
Thesis summary
-
بهبود كارايي شبكه هاي عصبي عميق با استفاده از حساب تقريبي و سنتز سطح بالا
سميه كياني 2022چكيده: امروزه الگوريتمهاي يادگيري ماشين و يادگيري عميق در زمينه هاي مختلف بسيار پركاربرد هستند. روش هاي متعددي براي حل مشكلات سرعت و زمان اجراي اين الگوريتم ها پيشنهاد شده ولي تا كنون به نتيجه اي كه بتوان اين الگوريتم ها را در زمان مناسب اجرا كرد، نرسيده اند. از آنجايي كه اين الگوريتم ها در بسياري از حوزه هاي هوش مصنوعي مانند بينايي ماشين، تشخيص گفتار، تشخيص جسم و ... كاربرد دارند، در اين پژوهش قصد داريم با استفاده از حساب تقريبي، كارايي و همچنين بهره وري انرژي مصرفي آنها را بهبود دهيم. در اين پايان نامه، نسخه اي جديد از روشهاي حساب تقريبي براي كاهش زمان اجرا در الگوريتم هاي شبكه هاي عصبي ارائه شده است، از آنجايي كه در اين الگوريتم ها مسئله اصلي زياد بودن زمان اجراي الگوريتم ها است، زمان اجرا را با استفاده از حساب تقريبي و رويكرد سنتز سطح بالا كم كرده ايم، بطوريكه دقت را تا حد ممكن قرباني زمان اجراي محاسبات مي كنيم. از طرفي هم مطلع هستيم كه شبكه هاي عصبي تحمل پذيري خطا دارند، پس لزومي ندارد كه پياده سازي الگوريتم هاي محاسباتي خيلي دقيق باشند؛ در نتيجه مي خواهيم دقت محاسبات را به اندازه اي كه مورد نياز است و دقت محاسبات الگوريتم را مختل نمي كند، طراحي كنيم. نتيجه اين كار باعث كوچكتر شدن مدار، بالا بردن سرعت پردازش يا فركانس كاري و همچنين كاهش توان مصرفي مدار است. هدف از انجام اين پايان نامه، بررسي عوامل موثر در بهبود سرعت و زمان اجراي الگوريتم هاي شبكه هاي عصبي كانولوشن در پردازش تصوير است. شبكه عصبي كانولوشن به عنوان يكي از بهترين و پركاربردترين شبكهها در زمينه پردازش و كلاسبندي تصاوير است. نتايج اين پژوهش نه فقط در بهبود كارايي كانولوشن، بلكه در بسياري از كاربردها و الگوريتم هاي يادگيري ماشين قابل تعميم است. ارزيابي نتايج اين پژوهش، با استفاده از گوگل كولب، ابزار سنتز سطح بالاي Vivado، و ALWANN framework محاسبه شده است. همچنين در اين كار از الگوريتم هاي پردازش تكاملي و ژنتيك هم در پياده سازي مدارها بهره برداري شده است و شبكه عصبي مورد استفاده در اين پژوهش ResNet است. نتايج اين پژوهش نشان مي دهد كه با داشتن دقت كلاس بندي 82 درصدي تصاوير، زمان انجام محاسبات، حداكثر تاخير مدار ضرب كننده و توان مصرفي در مقايسه با كارهاي مشابه، به ترتيب 2.5%، 33.5% و 41.93% كاهش داشته ا
Thesis summary
-
ارتقا خوشه بندي توزيع شده كلان داده
سحر احسني 2021امروزه داده ها با سرعت و حجم بسيار بالايي توليد مي شوند كه در موارد متعددي به صورت جريان داده هستند. جريان داده، يك توالي نامحدود از داده هايي است كه با سرعت و حجم بالا توليد مي شوند كه آن را به عنوان دنباله اي از اشيا داده اي در فواصل زماني تعريف مي نمايند. يكي از رايجترين پردازشهاي موجود در خصوص جريان داده ها خوشه بندي است كه به طوركلي هدف آن تقسيم داده ها در گروه هاي همگن ميباشد. يكي از الگوريتم هاي موجود براي خوشه بندي الگوريتم CluStream است كه شامل دو فاز آنلاين و آفلاين مي باشد و نسخه پياده سازي شده اي از آن در محيط توزيع شده آپاچي اسپارك نيز وجود دارد. الگوريتم CluStream در فاز آنلاين تعداد ثابتي از ريزخوشه ها را حفظ ميكند. اين امر در يك جريان داده در حال تكامل، با توجه به پيچيدگي داده هاي ورودي در جريان هاي دنياي واقعي، فرضي غيرعملي به نظر مي رسد. علاوه براين در اين الگوريتم داده هاي تاريخي را در طول جريان نگهداشته و مكانيزمي جهت حذف تدريجي خوشه هاي منقضي شده تعبيه نشده است. اين مسئله باعث ميشود با ورود مداوم جريان داده به مرور شعاع خوشه ها بزرگتر شده و دادههاي بيشتري به هر خوشه افزوده شود كه اين امر موجب كاهش دقت خوشهها ميگردد. در فاز آفلاين نيز خوشه هاي نهايي بر اساس پارامتر ثابتي تعيين مي شوند. ثابت در نظر گرفتن اين پارامتر در عمل ميتواند سبب شكستن يك خوشه به چند خوشه ديگر يا تجميع چندين خوشه با يكديگر شود و ممكن است كيفيت خوشه هاي تشخيص داده شده توسط الگوريتم را پايين آورد. جهت رفع مشكلات ذكر شده، در اين پاياننامه تغييراتي در فاز آنلاين و آفلاين الگوريتم CluStream صورت گرفته است. در روش پيشنهادي تعداد ريزخوشه ها در طول زمان تغيير ميكند. ريزخوشه هاي جديد به تدريج و در صورت نياز ساخته ميشوند و پس از رسيدن ريزخوشه ها به تعداد ماكزيمم، رفتار الگوريتم پيشنهادي همانند الگوريتم CluStream ميباشد. علاوه براين در فاز آنلاين به منظور حذف خوشه هاي منقضي شده دو ايده پيشنهاد شده است. ايده اول افزودن تابعي به نام تابع پاكسازي يا هرس جهت حذف خوشه هاي منقضي شده و ايده دوم استفاده از پنجره لغزان به منظور حفظ داده هاي اخير و حذف داده هاي قديمي تعبيه شده است. همچنين در فاز آفلاين الگوريتمي پيشنهاد شده است كه تعداد خوشه هاي نهايي را به صورت پويا مشخص ميكند. در
Thesis summary
-
ارائه چارچوبي جهت طبقه بندي كلان داده با استفاده از شبكه هاي عصبي ELM
روح اله صفايي 2021در سالهاي اخير رشد انفجاري داده ها به قدري شديد بوده است كه هر دو سال مقدار داده ها تقريبا دو برابر مي شود. تحت تاثير اين رشد انفجاري داده هاي جهاني، عبارت كلان داده جهت توصيف داده هاي بسيار حجيم، داري سرعت رشد بالا و تنوع زياد مورد استفاده قرار مي گيرد. بنابراين مي توان گفت روش ها، الگوريتم ها و چارچوب هاي كلاسيك يادگيري ماشين براي مديريت و پردازش اين مقدار داده ناتوان مي باشند. الگوريتمهاي يادگيري ماشين تا زماني كه با كلان داده به چالش كشيده نشوند نويد بهبودي نخواهند داد. طبقه بندي يكي از روشهايي است كه در تحليل داده ها به ما كمك مي كند، از جمله تحليل داده هاي ساخت يافته، تحليل داده هاي متني، تحليل داده هاي وب سايت، تحليل داده هاي چندرسانه اي، تحليل داده هاي شبكه، تحليل داده هاي تلفن همراه. بنابراين مي توان گفته مساله طبقه بندي امروزه روي كلان داده بسيار حايز اهميت مي باشد. رسيدن به راهكاري جهت طبقه بندي، در مواردي با حجم داده هاي بالا چون شبكه هاي اجتماعي، تراكنش هاي مالي، تشخيص نفوذ در شبكه، بسيار راه گشا خواهد بود. در اين پژوهش سعي بر آن شد تا به روشي دست پيدا كنيم كه با استفاده از شبكه عصبي ELM ، با سرعت بالا و منابع كمتر بتوانيم طبقه بندي كلان داده را انجام دهيم. كلان داده به علت حجم بالا به طور كامل در حافظه اصلي بارگذاري نمي شود بنابراين ما روشي ارائه داديم كه با بخش بندي مجموعه داده، و آموزش هر بخش بطور مجزا و در نهايت با استفاده از يك مجمع رده بندها كه هدف آن استفاده از خرد جمعي يعني استفاده از نظر همه رده بندهاي آموزش ديده مي باشد، با حداقل منابع سخت افزاري و در زماني مناسب به دقتي قابل قبول برسيم كه هم قابليت موازي سازي داشته باشد و هم با روشهاي مبتني بر معماريهاي موازي چون نگاشت كاهش و آپاچي اسپارك قابل رقابت باشد. نتايج روش پيشنهادي روي مجموعه داده MNIST داراي نرخ خطاي 5.62 درصد مي باشد كه تفاوت آن با روش هايي كه از معماريهاي موازي و توزيع شده مانند آپاچي اسپارك و نگاشت كاهش استفاده مي كنند، چندان معنادار نمي باشد.
Thesis summary
-
فهم سؤال در سيستمهاي پرسش و پاسخ با يادگيري عميق
مجيد كامران نژاد 2020پاسخ دادن به سؤال، يكي از شاخه هاي بازيابي اطلاعات و پردازش زبان هاي طبيعي است. به طوركلي، سيستم پرسش و پاسخ يك برنامه رايانه اي است كه مي تواند پاسخ ها را از مجموعه اسناد زبان طبيعي استخراج كند. يكي از حوزه هاي پرسش و پاسخ، درك مطلب ماشين است. درك مطلب ماشين، توانايي خواندن متن توسط ماشين و پاسخ دادن به سؤالات مطرح شده از متن است. به همين منظور سيستم بايد همانند انسان قادر به فهم درست كلمات متن و روابط بين آن ها باشد. با توجه به جديد بودن اين حوزه، بيشتر روش هاي ارائه شده مبتني بر يادگيري عميق هستند. روش پيشنهادي نيز مبتني بر يادگيري عميق است. در ابتدا، داده ها پيش پردازش شده و متن ها و سؤالات آن به كلمه و حروف تجزيه مي شوند. سپس كلمات با روش پنهان سازي GloVe و حروف با مقداردهي تصادفي به بردار عددي تبديل مي شوند و پس از كدگذاري با شبكه Bi-GRU به صورت متناظر با كلمات پاراگراف و سؤال الحاق مي شوند. با استفاده از شبكه Bi-GRU ماتريس جملات و سؤال كدگذاري شده و به وسيله مكانيسم توجه، توجه متن به سؤال به دست مي آيد. خروجي مكانيسم توجه توسط شبكه يادگيري افزايشي كدگذاري مي شود كه اين شبكه داراي لايه توجه خود تطبيق است. خروجي شبكه جهت تخمين پاسخ مورداستفاده قرارگرفته و پاسخ پيش بيني شده مورد ارزيابي قرار مي گيرد. در اين پژوهش از مجموعه داده SQuAD استفاده شده و سعي شده روشي ارائه شود كه به همراه افزايش سرعت اجرا، دقت و كارايي قابل قبولي ارائه دهد. نتايج بررسي نشان مي دهد كه مدل پيشنهادي به رشد مناسبي ازنظر سرعت و دقت نسبت به مدل هاي پيشين دست يافته است.
Thesis summary
-
تشخيص ناهنجاريها در شبكه هاي اجتماعي با استفاده از تكنيك هاي مبتني بر گراف
سعيد قادري پيراقوم 2020با رشد روز افزون «وب 2» و افزايش استفاده از شبكه هاي اجتماعي شاهد انقلاب عظيمي در سال 2002 با ظهور شبكه هايي نظير لينكداين و فيس بوك در سال 2004 رخ داد كه تابه حال با جذب ميلياردها كاربر از سرتاسر جهان به يكي از بزرگ ترين شبكه هاي اجتماعي تبديل گشته است. شبكه هاي اجتماعي به دليل اينكه محدوديت هاي جغرافيايي موجود در ارتباطات را از بين برده اند، كاربران بيشتري را روزبه روز به سمت خود جذب مي كنند. همچنين شبكه هاي اجتماعي در حوزه هاي مختلفي از قبيل تجارت، آموزش، بازاريابي از راه دور و موارد زياد ديگري كاربرد دارند. اما اين شبكه ها با گسترش انتشار اطلاعات در آن در معرض سوءاستفاده هايي نيز مي باشند ازجمله سرقت هويت ، انتشار اطلاعات جعلي ، هرزه نگاري و غيره كه اين نوع رفتارها در خلاف سياست گذاري هاي آن شبكه هست و معضلات و مشكلات زيادي را پيش روي آن شبكه مي گذارند. پيدا كردن اين چنين رفتارها در شبكه هاي مختلف، «تشخيص ناهنجاري ها» نام دارد. روش هاي مختلف تشخيص ناهنجاري با توجه به محيط اجراي آن ها توسعه داده شده اند كه روش هاي مبتني بر گراف در شبكه هاي اجتماعي كارايي زيادي را از خود نشان داده اند. همچنين در ميان روش هاي مختلف تشخيص ناهنجاري، روش هاي مبتني بر احتمال به دليل اينكه نياز به دانش اوليه و واردكردن داده ها در مورد رفتارهاي طبيعي ندارند، از اهميت ويژه اي برخوردارند و كارايي خود را در ارزيابي ها به خوبي نشان داده اند. در اين پايان نامه با بهره گيري از روش هاي مبتني بر گراف و روش هاي آماري بر اساس رفتار افراد در شبكه هاي اجتماعي، روش بيزين براي تشخيص ناهنجاري ها در شبكه هاي اجتماعي بهبود داده شد. همچنين روش پيشنهادي به صورت مستقل براي تشخيص ناهنجاري ها استفاده گرديد. روش پيشنهادي در محيط پايتون و متلب ، بروي مجموعه داده VAST 2008 اجرا گرديد. نتايج نشان داد روش پيشنهادي از دقت بيشتري برخوردار است.
Thesis summary
-
توليد ويديو از تصاوير با استفاده از شبكه مولد رقابتي
فاطمه سبحاني منش 2019پاسخ دادن به سؤال، يكي از شاخه هاي بازيابي اطلاعات و پردازش زبان هاي طبيعي است. به طوركلي، سيستم پرسش و پاسخ يك برنامه رايانه اي است كه مي تواند پاسخ ها را از مجموعه اسناد زبان طبيعي استخراج كند. يكي از حوزه هاي پرسش و پاسخ، درك مطلب ماشين است. درك مطلب ماشين، توانايي خواندن متن توسط ماشين و پاسخ دادن به سؤالات مطرح شده از متن است. به همين منظور سيستم بايد همانند انسان قادر به فهم درست كلمات متن و روابط بين آن ها باشد. با توجه به جديد بودن اين حوزه، بيشتر روش هاي ارائه شده مبتني بر يادگيري عميق هستند. روش پيشنهادي نيز مبتني بر يادگيري عميق است. در ابتدا، داده ها پيش پردازش شده و متن ها و سؤالات آن به كلمه و حروف تجزيه مي شوند. سپس كلمات با روش پنهان سازي GloVe و حروف با مقداردهي تصادفي به بردار عددي تبديل مي شوند و پس از كدگذاري با شبكه Bi-GRU به صورت متناظر با كلمات پاراگراف و سؤال الحاق مي شوند. با استفاده از شبكه Bi-GRU ماتريس جملات و سؤال كدگذاري شده و به وسيله مكانيسم توجه، توجه متن به سؤال به دست مي آيد. خروجي مكانيسم توجه توسط شبكه يادگيري افزايشي كدگذاري مي شود كه اين شبكه داراي لايه توجه خود تطبيق است. خروجي شبكه جهت تخمين پاسخ مورداستفاده قرارگرفته و پاسخ پيش بيني شده مورد ارزيابي قرار مي گيرد. در اين پژوهش از مجموعه داده SQuAD استفاده شده و سعي شده روشي ارائه شود كه به همراه افزايش سرعت اجرا، دقت و كارايي قابل قبولي ارائه دهد. نتايج بررسي نشان مي دهد كه مدل پيشنهادي به رشد مناسبي ازنظر سرعت و دقت نسبت به مدل هاي پيشين دست يافته است.
Thesis summary
-
تشخيص موجوديت هاي هم مرجع با استفاده از شبكه هاي عصبي عميق
منوچهر برقراري 2019هدف از اين پژوهش يافتن موجوديت هايي است كه در يك متن، سند يا گفتگو وجود دارند و در دنياي واقعي به ماهيت هاي يكساني اشاره دارند. براي اين كار پايگاه داده ي conll 2012 shared task dataset را در اختيار داريم كه تمام موجوديت هاي ما در اين پايگاه داده موجود است. ما در اين پژوهش دو موجوديت را در نظر خواهيم گرفت و سپس تصميم مي گيريم كه آيا اين دو موجوديت هم مرجع هستند يا خير. براي تصميم گيري درباره ي هم مرجع بودن موجوديت ها از شبكه هاي عصبي عميق استفاده كرده ايم و آنها نقش كلاس بند سيستم ما را ايفا خواهند كرد. چون براي هر كلاس بند همواره نياز به تعدادي ويژگي هست ما نيز شروع به استخراج ويژگي هاي مهم و جداساز كرده ايم. تاكنون از ويژگي هاي متعددي در كلاس بندي سيستم هاي تشخيص موجوديت هاي هم مرجع استفاده شده است. مانند ويژگي هاي عددي و رشته اي و يا تركيبي. ما بنا به نياز خود براي به دست آوردن انواع ويژگي هاي جداساز سراغ سه پايگاه داده رفته و ويژگي هاي موردنظر را از آن استخراج نموده ايم. ويژگي هاي عددي همواره در پردازش زبان هاي طبيعي از اهميت بالايي برخوردار بوده اند. در پژوهش ما نيز اين ويژگي ها به عنوان يك ويژگي مهم و جداساز لحاظ شده اند. براي ويژگي هاي رشته اي نيز از بردار ويژگي استفاده كرده ايم و به جاي هر جمله يا كلمه يا عبارت بردار ويژگي آن به عنوان ورودي به كلاس بند داده شده است. در ابتدا يك شبكه ي عصبي ساده شروع به كلاس بندي داده هاي ورودي مي نمايد. اين كلاس بند تنها از يك لايه ي مخفي استفاده مي كند. نتيجه ي اين كلاس بند موردقبول است اما با توجه به سادگي آن انتظار مي رود با به كارگيري كلاس بندي پيچيده تر شاهد نتايج بهتري باشيم. در ادامه از پرسپترون چندلايه استفاده كرده ايم و نتايجش را با شبكه ي عصبي ساده مقايسه مي نماييم. سپس به سراغ شبكه ي عصبي كانوولوشن مي رويم. انتظار داريم اين شبكه عملكرد بسيار خوبي داشته باشد. اين شبكه را در حالت هاي مختلفي آزمايش مي كنيم تا بهترين حالت را انتخاب كرده باشيم. بعد از اتمام كار با اين شبكه نوبت به ماشين بردار پشتيبان است. هسته ي اين ماشين را در مراحل مختلف تغيير داده و نتايج را مدل هاي قبلي مقايسه مي نماييم
Thesis summary
-
برچسب گذاري تصاوير با استفاده از شبكه مولد رقابتي
دانيال ابراهيم زاده 2019امروزه با رواج رسانه هاي اجتماعي و دوربين هاي ديجيتال، تصاوير ديجيتال براي عموم مردم بيشتر قابل دسترس است. بيشتر كاربران رسانه هاي برخط مانند Flicker و instagram مايلند تصاوير خود را با آشنايان و دوستان خود به اشتراك بگذارند. معمولا زماني كه كاربران تصاوير خود را به اشتراك مي گذارند از كلماتي كوتاه براي توصيف آن تصوير استفاده مي كنند، اين فرآيند «برچسب زدن تصاوير» يا «تگ زدن تصاوير» مي باشد. يك سيستم خودكار تگ زننده بايد بتواند براي تصوير تگ هاي مناسب آن را به دست بياورد. «برچسب زدن تصاوير» به صورت خودكار يكي از مسائل مهم و كاربردي در حوزه پردازش تصوير است. برچسب زدن تصاوير داراي كاربرد هايي است كه از آنها در زمينه توسعه كارهاي كامپيوتري استفاده مي شود. از جمله اين كاربردها مي توان به جستجوي سريع تصاوير به كمك برچسب ها، افزايش كيفيت جستجو در موتورهاي جستجو، افزايش تعداد بازديدكنندگان سايت و افزايش كيفيت در اشتراك گذاري تصاوير اشاره كرد. عمل تگ زدن تصوير به طور كلي به سه صورت مي تواند انجام شود: 1) به صورت دستي كه كاربر خود براي تصوير تگ مي زند؛ 2) به صورت نيمه خودكار كه يك نرم افزار به كاربر براي تگ زدن كمك مي كند؛ 3) به صورت خودكار كه نرم افزار تگ تصوير را مي زند. براي تگ زدن تصوير نياز است تا محتواي تصوير به خوبي شناسايي شود. براي درك محتواي تصوير بايد ويژگي هاي مناسب از تصوير شناسايي شود. براي شناسايي ويژگي ها مي توان از تكنيك هاي مختلف يادگيري ماشين مانند شبكه هاي عصبي عميق و ... استفاده كرد. موضوع قابل اشاره در اينجا استفاده از شبكه RBM و شبكه عصبي مولد رقابتي است براي ايجاد تگ براي تصاوير است. به طور ضمني در شبكه مولد رقابتي دو مدل مولد و جداكننده به صورت رقابتي آموزش داده مي شوند. اين دو شبكه در كنار يكديگر در يك روند رقابتي آموزش ديده و سعي در توليد داده ها با كارايي بالا دارند. اين كار بر روي مجموعه داده هاي Cifar100 و Corel10k مورد آزمايش قرار مي گيرد و نتايج به دست آمده نشان مي دهد كه مدل طراحي شده در بين مدل هاي مولد نتايج بهتري به همراه داشته است. همچنين از تصاوير توليد شده توسط شبكه مولد براي بحث افزايش داده استفاده شده و برچسب گذاري انجام مي شود كه موجل افزايش دقت به دست آمده مي شود.
Thesis summary
-
كاوش زماني موضوع با استفاده از روش FCA
اميرحسين زند 2019امروزه اطلاعاتي كه در سطح وب وجود دارد، بسيار زياد است و هرروز اين اطلاعات در حال افزايش است، پيدا كردن موضوعات و اطلاعات موردنياز مشكلي هست كه سازمان ها با آن روبه رو هستند، دراين بين يكي از مهم ترين داده ها در سطح وب، داده هاي سايت توييتر محسوب ميشود و علت آن به روز بودن و فراگير بودن آن است. درنتيجه نياز به روش هايي كه اين داده ها را به اطلاعات مفيدتري تبديل كنند رو به افزايش است. البته اين داده ها به علت كوتاه بودن ابعاد برخلاف اسناد معمولي استخراج اطلاعات را با چالش مواجه كرده است. در بين روش هاي موجود براي كاوش موضوع مدل هاي موضوعي به خصوص مدل موضوعي ديريكله يكي از محبوب ترين و موفق ترين روش ها محسوب ميشود. گرچه اين مدل براي اسناد معمول ارائه شده است اما كاوش موضوع با اين روش عملكرد مطلوبي ندارد. به همين دليل اكثر محققان روش هاي ديگري را براي كاوش موضوع از توييتر ارائه مي كنند. درحالي كه اين روش با محاسبه مقادير پنهان در داده ها مي تواند روابط بين توييت ها را استخراج كند. در اين پايان نامه مسئله كاوش زماني داده هاي توييتر با تركيب روش هاي آماري و منطق رياضي موردبررسي قرارگرفته اند. در ابتدا داده ها از سايت توييتر جمع آوري شده و سپس براي دقت بهتر اطلاعات وابسته به متن توييت، انتخاب موضوعات را در هر بازه ي زماني موردتوجه قرار مي دهيم. سپس داده هايي كه داراي اطلاعات مفيد و موردنياز هستند پالايش مي شوند و به عنوان ورودي مدل موضوعي مورداستفاده قرار مي گيرند. به منظور افزايش دقت كاوش موضوعات، ديگر روش هاي كاوش موضوعات براي انتخاب موضوعات برتر مورداستفاده قرار مي گردد و سپس براي هر موضوع از روش هاي مبتني بر تجزيه وتحليل مفاهيم رسمي، موضوعات مختلف در هر بازه زماني به دست مي آيد. براي ارزيابي كار آيي روش پيشنهادي ابتدا وابستگي بين موضوعات و داده ها بررسي مي شوند و سپس نتايج حاصل با ديگر روش هاي مطرح در مجموعه دادگان مقايسه مي گردد. نتايج حاصل از پياده سازي نشان مي دهد كه روش پيشنهادي براي كاوش زماني موضوع به دقت و عملكرد قابل قبولي دست پيداكرده است.
Thesis summary
-
شمارش، كلاس بندي و تشخيص سرعت وسايل نقليه عبوري از يك محور مبتني بر پردازش تصاوير ويدئويي
عليرضا طاهري طجر 2019تشخيص نوع و سرعت خودروها در جادهها، نقش مهمي در كاربردهاي مربوط به سيستمهاي حمل و نقل هوشمند جهت افزايش امنيت و سهولت تردد وسايل نقليه در جادهها ايفا ميكند. روشهاي موجود براي تشخيص نوع خودرو، روشهايي هستند كه با استفاده از حسگرهاي مختلف، از جمله حسگرهاي مغناطيسي، ليزري، راداري و... اطلاعات مورد نياز براي تشخيص را بدست آورده و آنها را مورد بررسي قرار ميدهند، اما در اين ميان استفاده از روشهاي مبتني بر تصاوير يا ويدئوها، با توجه به اعتبار مناسب نتايج، مورد توجه قرار گرفتهاند. تشخيص خودرو ميتواند در دو سطح صورت گيرد: اينكه نوع خودرو، تنها از نظر ابعاد و ويژگيهاي كلي ظاهري آن تعيين شود ) تقسيم بندي به گروههاي سواري، سنگين و ... ( و يا اينكه به طور جزئيتر، مدل و شركت سازنده خودرو هم تعيين شود. در اين پايان نامه براي بخش تشخيص خودرو، از ويدئوهاي نماي نزديك و روبرو كه از مجموعه دادههاي موجود تهيه شده استفاده شده است. در اين پاياننامه از الگوريتمهاي بلادرنگ مبتني بر هوش مصنوعي )يادگيري عميق( براي تشخيص نوع و طبقه بندي كلاس خودروهاي عبوري از محورهاي مواصلاتي استفاده شده،كه سعي بر غلبه بر چالش هاي جدي روشهاي موجود مورد استفاده دارد. در اين رويكرد تعداد زيادي از تصاوير موجود در مجموعه دادههاي مختلف شامل شش كلاس خودرو، به عنوان دادههاي آموزشي به شبكه وارد شده و با استفاده از الگوريتم يادگيري عميق موسوم به YOLOv3 اقدام به فرآيند شناسايي خودرو شده است. همچنين به منظور رديابي خودروها در تصاوير ويدئويي پس از شناسايي، الگوريتمهاي مختلفي بررسي و در نهايت از الگوريتم Median flow در اين پايان نامه بهره گرفته ايم. در پايان نيز با استفاده از الگوريتمهاي تشخيص سرعت، روشي به جهت محاسبه سرعت خودروهاي عبوري ارائه شده است.
Thesis summary
-
پاسخ به پرسش هاي مطرح شده از تصاوير به كمك تكنيك هاي يادگيري عميق
مجيد رفيعي 2019پاسخ گويي به پرسش هاي مطرح شده از تصاوير (VQA)، يك مسئله ي تحقيقاتي ميان رشته اي در هوش مصنوعي است. اين مسئله علاوه بر بينايي ماشين، حوزه هاي ديگري همانند پردازش زبان هاي طبيعي و نمايش دانش و استدلال را نيز پوشش مي دهد. از آن جا كه VQA، محيطي عملياتي براي سنجش درك عميق تصاوير به حساب مي آيد، طي ساليان گذشته با اقبال پژوهشگران حوزه ي هوش مصنوعي مواجه شد است. پژوهش پيش رو، به منظور ارائه ي راهكاري براي حل مسئله ي VQA طرح ريزي شده است. با آن كه در چند سال گذشته، تمامي روش هاي سرآمد VQA از معماري هاي نسبتاً پيچيده اي استفاده كرده اند، اما پژوهش هاي اخير نشان مي دهد، مدل هاي ساده تر نيز به شرط پياده سازي مناسب مي توانند عملكردي در حد مدل هاي پيچيده ارائه نمايند. بر اين اساس، در پژوهش جاري تلاش شده است تا مدلي ساده، سريع و قابل فهم براي حل مسئله ي VQA طراحي گردد كه عملكرد قابل قبولي نيز داشته باشد. سنگ بناي روش پيشنهادي، بر پايه ي روش Anderson و همكاران ] [ پي ريزي شده است. مهم ترين مزيت اين روش، ارائه ي سازوكاري تحت عنوان مكانيزم توجه پايين به بالا براي استخراج ويژگي هاي تصوير است. روش انتخاب شده با اتكا بر قابليت فوق العاده ي خود در تشخيص اشياء موفق به كسب رتبه نخست چالش VQA 2017 شده است. روش پيشنهادي اين پژوهش، بر مبناي شبكه هاي عصبي عميق بنا نهاده شده و از رويكرد مرسوم تعبيه سازي توأم ويژگي هاي تصوير و پرسش بهره مي برد. به صورت خلاصه، مدل پيشنهادي از پنج بخش اصلي تشكيل گرديده است:استخراج ويژگي هاي تصوير، تعبيه سازي پرسش، مكانيزم توجه، ادغام ويژگي ها و در نهايت توليد پاسخ. روش پيشنهادي پس از پياده سازي به كمك چارچوب يادگيري عميق Pytorch، بر روي ديتاست VQA v2.0 ] [ آموزش ديده است. در مسايل يادگيري عميق، بخش مهمي از هر پژوهش به تنظيم پارامتر هاي شبكه از طريق اعتبارسنجي و آزمايش هاي تجربي اختصاص مي يابد از اين رو، در اين پژوهش نيز به قصد دستيابي به مدلي بهينه، آزمايش هاي فراواني در جهت انتخاب بهترين معماري و بهينه ترين hyperparameterها صورت پذيرفته است. پس از انجام اين فرآيند بهينه سازي، درنهايت، مدلي به دست آمده است كه با كسب 65.19 درصد از امتياز هاي بخش test-dev ديتاست، در حدود 2 درصد نسبت به روش پايه بهبود داشته است. باوجود اين افزايش، اما نتايج نهايي مدل پيشنهادي نسبت
Thesis summary
-
روشي براي بهينه سازي برنامه ريزي تخصيص منابع در رايانش ابري
شيوا طينه زاده 2019رايانش ابري يك محيط پردازشي توزيع شده بر روي بستر اينترنت، باقابليت ارائه سرويس هاي متنوع است. اين محيط با كاهش هزينه هاي سرباري مختلف مثل هزينه دستگاه هاي پردازشي متنوع و هزينه خريد حافظه هاي زياد و افزايش ميزان بهره وري مثل استفاده از منابع محاسباتي در دسترس و ارزان، يك بستر محاسباتي قوي را بر اساس ارائه كيفيت خدمات سرويس بين مشتري و فراهم كنندگان ابر ايجاد مي كند. يكي از مسائل پيش رو در رايانش ابري زمان بندي وظايف براي تخصيص منابع محاسباتي به وظايف به صورتي كه در كمترين زمان به درخواست ها پاسخ داده شود، است. مسئله ي زمان بندي در رايانش ابر، تكنيكي براي توزيع عادلانه ي منابع بين مشتريان است كه به منظور دستيابي به بهره وري بهينه ي منابع با كمترين زمان پاسخ است. امروزه كارهاي بسياري در اين حوزه صورت گرفته است و الگوريتم هاي متنوعي به منظور بهبود در هزينه يا زمان زمان بندي وظايف در محيط رايانش ابر ارائه شده است. ازجمله ي اين الگوريتم ها مي توان به الگوريتم هاي ژنتيك، ازدحام ذرات، كلوني مورچه، جهش قورباغه و غيره، اشاره كرد. در اين پايان نامه با توجه به اين كه الگوريتم كلوني مورچه دير به جواب مي رسد و الگوريتم ازدحام ذرات به صورت تصادفي مسير خود را انتخاب مي كند، از اين دو الگوريتم براي پوشش معايب يكديگر استفاده شده است تا بتوان نتيجه ي دقيق تر و سريع تري به دست آورد. در اين تحقيق، به كمك الگوريتم كلوني مورچه يك جمعيت اوليه براي الگوريتم ازدحام ذرات ايجاد مي شود. در اين حالت، جمعيت اوليه ي دقيق-تري نسبت به انتخاب تصادفي جمعيت اوليه خواهيم داشت. درنتيجه ذرات مي توانند همه ي نقاط را تحت پوشش قرار دهد و در نقطه بهتري از اين لحاظ كه كدام ماشين مجازي براي تخصيص درخواست مناسب تر است همگرا شوند. در اين تحقيق، براي ارزيابي از شبيه ساز مناسب رايانش ابري كه كلودسيم است، براي ارزيابي استفاده شده است. درنتيجه ي اين تحقيق الگوريتمي ارائه مي شود كه الگوريتم هاي مورداستفاده را بهبود بخشد و نتيجه ي بهينه تري از الگوريتم هاي پيشين در ارزيابي بدهد.
Thesis summary
-
برچسب گذاري تصاوير بدون نمونه آموزشي با كمك شبكه هاي عصبي بازگشتي
مهرداد باقري 2019امروزه، تصاوير نقش مهمي را در جا به جايي و انتقال اطلاعات و مفاهيم بر عهده دارند. تصوير برداري شخصي و اشتراك تصاوير در رسانه هاي اجتماعي، صفحات اينترنتي، مباحث علمي همچون هواشناسي و زمين شناسي، مسائل جرم شناسي همچون تشخيص چره و اثر انگشت و .... همگي نمونه هايي از كاربرد تصاوير در عرصه هاي مختلف هستند. براي استفاده از تصاوير در موارد ذكر شده، نيازمند روش هايي هستيم كه به صورت خودكار به بررسي و تحليل تصاوير بپردازند. برچسب زني و طبقه بندي تصاوير، از جمله مواردي است كه در سال هاي اخير، در زمينه پردازش تصاوير بسيار مورد توجه قرار گرفته است. يكي از چالش هاي موجود در اين راستا، محدوديت هاي مجموعه دادگان تصاوير، در زمينه برچسب گذاري و توصيف تصاوير است. چرا كه به صورت روزمره عناوين و مفاهيم و احساسات جديدي به تصاوير نسبت داده مي شود كه همگي آن ها در مجموعه داده هاي مورد استفاده قابل ذخيره سازي نيستند. از اين رو ارائه روش هاي كه بتوانند بدون نمونه هاي آموزشي به برچسب زني تصاوير بپردازند؛ به يكي از مسائل چالش برانگيز در سال هاي اخير تبديل شده است.
Thesis summary
-
تشخيص نقل به مضمون با استفاده از تكنيك هاي يادگيري عميق
حسن شاه محمدي 2019چكيده: تشخيص نقل به مضمون يكي از مسائل مهم در حوزه پردازش زبان هاي طبيعي است. نقل به مضمون به جملات يا عباراتي اشاره مي كند كه معني و مفهوم يكساني را به خواننده منتقل مي كنند اما ساختار و كلمات آن ها با هم متفاوت است. اين مسئله كاربردهاي فراواني در حوزه پردازش زبان هاي طبيعي دارد. ازجمله اين كاربردها مي توان به استفاده آن در خلاصه سازي متن، ترجمه ماشيني، سيستم هاي پرسش و پاسخ، تشخيص سرقت ادبي و موتور هاي جستجو اشاره كرد. در اين پژوهش، ابتدا مسئله با چندين روش مرسوم مانند وزن دهي TF-IDF و استفاده از طبقه بند هايي همچون ماشين بردار پشتيبان، حل و ارزيابي شده است. سپس با استفاده از نتايج بدست آمده از اين روش ها، يك مدل جديد براي تشخيص نقل به مضمون ارائه شده است. مدل پيشنهادي را مي توان به دو بخش تقسيم نمود. در بخش اول كه مسئله با تكنيك هاي يادگيري عميق حل مي-شود، جملات پس از عبور از مرحله پيش پردازش، با استفاده از تكنيك پنهان سازي GloVe به بردار هايي عددي تبديل مي-شوند. خروجي اين لايه پنهان سازي سپس به يك شبكه Bi-LSTM براي بيان كردن كل جمله داده مي شود. پس از اتمام آموزش مدل، خروجي اين شبكه به عنوان ويژگي هاي استخراج شده براي هر جمله در نظر گرفته مي شوند. در بخش دوم، يك سري ويژگي دستي براي بيان كردن ميزان شباهت معنايي بين دو جمله معرفي مي شوند. از ميان اين ويژگي ها، تعدادي از آن ها جديد بوده و براي اولين بار در اين پژوهش معرفي شده اند. مدل پيشنهادي از تركيب ويژگي هاي بدست آمده در اين دو بخش حاصل مي شود. دو مجموعه داده با نام هاي MSRP و Quora براي ارزيابي مدل پيشنهادي در نظر گرفته شده اند. نتايج مدل براي مجموعه داده MSRP نشان مي دهد كه اين مدل تقريبا از تمام پژوهش هاي انجام شده، كارايي بهتري از نظر صحت و f-measure را كسب مي كند. نتايج ارزيابي مدل براي مجموعه داده Quora نيز كارايي قابل قبول و قابل مقايسه اي با ساير پژوهش هاي انجام شده روي اين مجموعه داده را نشان مي دهد. به طوري كه مدل پيشنهادي جزء 24 درصد برتر روش ها از ميان بيش از 3000 تيم در سايت Kaggle است. نتايج ارزيابي همچنين نشان مي دهد كه مدل پيشنهادي براي مجموعه داده-هايي با تعداد نمونه هاي كم، كارايي بهتري در مقايسه با ساير مدل هاي جديد دارد.
Thesis summary
-
تشخيص سرقت ادبي از نوع نقل به مضمون
محمدهادي محمدي 2018سرقت ادبي استفاده دوباره با كپي كردن متني بدون ارجاع به نويسنده ي اصلي است. تشخيص سرقت ادبي به مجموعه راهكارهايي گفته مي شود كه استفاده از آن ها به كشف دستبرد علمي منجر مي شود. استفاده از تكنيك هاي يادگيري ماشين و شبكه عصبي مصنوعي يكي از روش هاي مرسوم جهت تشخيص سرقت ادبي است و اين روش ها سرعت كشف و بازدهي خوبي دارند ولي چيزي كه تشخيص سرقت ادبي را مشكل مي كند وقتي است تشخيص سرقت ادبي از نوع نقل به مضمون ، paraphrase plagiarisim، اتفاق مي افتد . براي تشخيص سرقت ادبي از نوع نقل به مضمون در اين پژوهش از تركيب روش هاي واژگاني، نگارشي، معنايي استفاده شده است، با پيش پردازش اسناد مورد بررسي و تبديل برداري رشته هاي لغوي جملات اصلي و غير اصلي داده هاي خود را جهت بررسي آماده كرديم، ازالگوريتم jaccard و الگوريتم lcs در سه حالت براي تشخيص سرقت ادبي از نوع واژگاني و ساختاري استفاده شده است،تابع lcs متقاطع و lcs معكوس براي به دست آوردن سرقت ادبي از نوع نقل به مضمون ارائه شده است واز آنجاكه هر چه پايگاه دانش غني تر شود تشخيص سرقت ادبي معنايي بهبود مي يابد، از تبديل هاي برداري word2vec و glove استفاده شده است، براي ساخت پايگاه دانش شبكه در glove از همان داده هاي آموزش خود اين پايگاه را ساختيم و بردارهاي عددي جملات را جهت بررسي استخراج كرديم ولي در word2vec از پايگاه دانشي كه گوگل آن را با داده هاي متني گسترده اي آموزش داده بود استفاده كرديم و داده هاي عددي را از آن استخراج كرديم. در مجموع تعداد نه ويژگي بدست آمده از روش هاي مختلف را جهت آموزش به شبكه داديم و در طبقه بندي شبكه از طبقه بنده هاي مختلف مثل svm,naive bayse,rbf استفاده كرديم و به بررسي آنها روي داده هاي متني پرداختيم و به اين نتيجه رسيديم كه بهترين حالت تركيب طبقه بندها بوده است كه در اين حالت توانستيم تشخيص سرقت ادبي را بهبود ببخشيم و به بازدهي 75.8 برسيم.
Thesis summary
-
بازيابي تصوير مبتني بر محتوا با استفاده از مدل كيسه اي از واژگان چند سطحي
اكبر مقيميان 2018بازيابي تصوير مبتني بر محتوا استفاده از روش هاي بينايي ماشين براي بازيابي تصاويري از يك مجموعه است كه ازنظر محتوا به تصوير پرسش شبيه باشند. چالش اصلي سيستم هاي بازيابي تصوير كاهش شكاف معنايي بين ويژگي هاي ديداري سطح پايين تصوير و مفاهيم سطح بالاي موجود در آن است. دليل اصلي شكاف معنايي اين است كه پيكسل ها و تكه هاي تصوير در بيشتر موارد مفاهيم معنايي كمي را با خود حمل مي كنند. يكي از روش هاي كاهش اين فاصله استخراج ويژگي هاي سطح بالا در بازيابي تصوير است. از طرفي براي تفكيك تصاويري از دو گروه مختلف كه به وسيله ويژگي هاي سطح بالا قابل تفكيك نيستند، به ويژگي هاي سطح پايين نيز احتياج داريم. در اين پژوهش ويژگي هاي ديداري در چهار سطح پيكسل، ناحيه، شيء و مفهوم استخراج شده و تصاوير در اين چهار سطح با استفاده از مدل كيسه اي از واژگان نمايه سازي مي شوند. سپس از همجوشي اطلاعات اين چهار سطح به منظور كاهش شكاف معنايي و بهبود دقت و فراخواني بازيابي استفاده مي شود. در سطح پيكسل ويژگي هاي SIFT، فيلتر گابور و گشتاورهاي رنگ از تصاوير استخراج مي شود. در سطح ناحيه ابتدا تصوير با استفاده از الگوريتم Jseg به چند ناحيه افراز شده و سپس ويژگي هاي رنگ و بافت با استفاده از توصيفگر Hue و LBP از هر يك از نواحي تصوير استخراج مي شود. در سطح شيء از شبكه عصبي كانولوشني AlexNet براي بازشناسي اشياء و صحنه هاي درون تصوير استفاده مي شود و در سطح مفهوم از بازنمايي برداري واژگان متناظر با اين اشياء و صحنه ها، براي سنجش شباهت معنايي تصاوير استفاده مي شود. بازنمايي برداري واژگان با استفاده از شبكه عصبي Word2vec انجام مي شود. براي ساختن يك سيستم بازيابي تصوير مبتني بر محتواي چندسطحي نيز از دو راهكار همجوشي در سطح تصميم و همجوشي ويژگي ها استفاده شده است. نتايج اين مطالعه امكان سنجي روش پيشنهادي و بهبود عملكرد كلي سيستم بازيابي را در مجموعه تصاوير مختلف تائيد مي كند.
Thesis summary
-
ارائه يك روش تركيبي و نيمه نظارتي مبتني بر گراف براي برچسب زني خودكار تصاوير
مجتبي كردابادي 2018با رشد سريع تعداد تصاوير توليدشده در صفحات وب و شبكه هاي اجتماعي سازمان دهي و بازيابي تصاوير به روشي مؤثر و كارا به وسيله موتورهاي جستجو يكي از حوزه هاي پژوهشي فعال مي باشد. موتورهاي جستجو در بازيابي داده هاي متني دقت و سرعت مناسبي دارند و اين امر باعث شده است تا پژوهشگران جهت بازيابي تصاوير، ابتدا مجموعه دادگان حاوي تصاوير را با اطلاعات متني برچسب زني كنند و سپس بازيابي را در حوزه متن انجام دهند. برچسب زني تصاوير مي تواند به صورت دستي يا خودكار انجام گيرد. درروش دستي، برچسب زني تصاوير توسط افراد خبره انجام مي پذيرد. به دليل رشد سريع تعداد تصاوير توليدشده در صفحات وب و شبكه هاي اجتماعي، استفاده از اين روش بسيار وقت گير، خسته كننده و پرهزينه و عملاً غيرقابل استفاده مي باشد، ازاين رو روش هاي برچسب زني خودكار تصاوير معرفي شدند. در سامانه هاي بازيابي تصوير، برچسب زني خودكار تصوير به عنوان يك مرحله اوليه و پيش پردازشي در سيستم در نظر گرفته مي شود. يادگيري نيمه نظارتي نوعي از روش هاي يادگيري ماشين است كه از داده هاي برچسب دار و بدون برچسب استفاده مي كند. روش هاي يادگيري معمول به دودسته يادگيري با نظارت و بدون نظارت تقسيم مي شود. در روش هاي يادگيري بدون نظارت همه داده هاي آموزشي بدون برچسب بوده اند و در يادگيري با نظارت همه داده هاي آموزشي داراي برچسب هستند. هدف از يادگيري نيمه نظارتي اين است كه به اين پرسش پاسخ داده شود كه چگونه مي توان با تركيب داده هاي برچسب دار و بدون برچسب رفتار يادگيري را تغيير داد و الگوريتم هايي را طراحي كرد كه از فوايد اين تركيب ها استفاده كنند. يادگيري نيمه نظارتي در يادگيري ماشين و داده كاوي بسيار موردعلاقه است زيرا به آساني مي توان با داده هاي بدون برچسب در دسترس كارايي يادگيري بانظارت را با توجه به عدم دسترسي و گران بودن داده هاي با برچسب بالا برد. توجه به روشهاي يادگيري نيمه نظارتي مبتني بر گراف در سالهاي اخير رشد چشمگيري يافته است. دليل اين امر را مي توان ارائه ساختار شباهت و تفاوت براي تصاوير بر اساس گراف دانست كه در آن خواصي نظير همسايگي راس ها، فاصله و مسيرهاي بين راس ها و همچنين توازن و تراكم راس ها در نواحي گراف با مفاهيم طبيعي قابل درك براي انسان قرابت زيادي دارد.پژوهش حاضر در مورد برچسب زني تصاوير با استفاده از روش هاي يادگيري نيمه نظ
Thesis summary
-
طراحي نرم افزار جيره نويسي گاوهاي شيري
مجتبي شريفي نيا 2017امروزه از نرم افزار هاي مختلفي جهت جيره نويسي دام هاي شيري در ايران استفاده مي شود كه برخي از آن ها تحت ويندوز هستند و برخي ديگر بر پايه صفحات گسترده اكسل طراحي شده اند. تمام اين نرم افزار ها به زبان انگليسي هستند و از آن جايي كه بيش از 75 درصد گاوداري هاي ايران به صورت سنتي اداره مي شود استفاده از آن ها براي كاربران ايراني و دامپروران سنتي و تا حدودي براي دامپروران صنعتي مشكل است. همچنين نرم افزار هاي رايج در كشور متناسب با نياز هاي ايران نيستند و خوراك هاي موجود در كتابخانه خوراك آن ها با خوراك هايي كه در دامداري هاي ايران استفاده مي شود تفاوت دارد. نرم افزار جيره نويسي BASU Dairy يك نرم افزار تحت ويندوز به زبان فارسي است كه از رابط كاربري ساده و رواني برخوردار است. اين نرم افزار متناسب با نياز كاربران ايراني و بر اساس خوراك و شرايط موجود در ايران طراحي و توسعه پيدا كرده است. براي طراحي اين نرم افزار از زبان برنامه نويسي سي شارپ استفاده شد و ديتابيس اكسس براي كتابخانه خوراك آن انتخاب شد. اين نرم افزار بر اساس استاندارد NRC 2001 نوشته شده است و سعي شده تا ايرادات نرم افزار مشابه خود را برطرف نمايد و با ظاهري كاملا متفاوت جيره نويسي براي دام هاي شيري را در سريعترين زمان و ساده ترين شكل ممكن به انجام برساند.
-
استخراج اطلاعات از متن نظرآنلاين كاربران به كمك مدل سازي موضوعي
نرگس نعمتي فرد 2017براي توليدكنندگان، مقايسه عقايد مشتريان درباره ي محصولاتشان و محصولات رقبايشان براي كشف نقاط ضعف و قوت جهت موفقيت در بازاريابي و تعيين جايگاه كالا بسيار مهم است. مصرف كنندگان نيز با توسعه وب و شبكه هاي اجتماعي نظرات خود را درباره ي محصول با ديگران به اشتراك مي گذارند كه اين نظرها به عنوان يك منبع مهم مي تواند مورد استفاده قرار بگيرد. عقايد منفي نسبت به عقايد مثبت براي توليد كنندگان جهت پيدا كردن مشكلات محصول و دليل نارضايتي از محصول مهم تر است. هدف ما در اين پژوهش استخراج نظرات حاوي گزارش نقص جهت كمك به توليد كنندگان در تصميم گيري هاي كاربردي است. در اين پژوهش تكنيك هاي محاسبه ي تشابه اسناد توسط OkapiBM25، طبقه بندي با جنگل تصادفي، خوشه بندي Kmeans، مدل سازي آماري ميدان تصادفي شرطي، مدل سازي موضوعي و بازيابي اسناد را بررسي كرديم. براي تحليل و ارزيابي روش هاي پيشنهادي از داده هاي جمع آوري شده وب سايت آمازون استفاده كرديم. روش جنگل تصادفي را براي تشخيص گزارش نقص و تكنيك بدون ناظر مدل سازي موضوعي تخصيص پنهان ديريكله را براي ارائه ي خلاصه اي از گزارش نقص در نظر گرفتيم. نتايج نشان داد جنگل تصادفي با تعداد كم داده هاي آموزشي عملكرد خوبي براي كشف گزارش نقص دارد و مي توان با استفاده از روش تخصيص پنهان ديريكله اطلاعات مناسبي از اسناد حاوي گزارش نقص گزارش به دست آورد.
Thesis summary
-
نظركاوي جنبه گرا به كمك استخراج روابط معنايي
مايده شيخ حسني 2017يكي از دغدغههاي مصرف كننده محصولات، داشتن يك پيش زمينه ذهني با توجه به نظرات خريداران قبلي، نسبت به يك محصول، قبل از تصميم گيري براي خريد آن است.در كنار مصرف كنندگان، توليدكنندگان هم براي بهبود محصولات قبلي و پيشي گرفتن در بازار فروش نسبت به رقيبان به نظرات مصرف كنندگان محصولات خود اهميت ميدهند. امروزه با افزايش توليد برخط محتوا توسط كاربران در شبكههاي اجتماعي درباره يك شي واقعي يا انتزاعي، امكان رسيدن به اهداف بالا فراهم شده است. اما وجود انبوهي از اطلاعات، تحليل آن ها را سخت كرده است به همين دليل نظركاوي از جايگاه ويژهاي در متن كاوي برخوردار است. نظركاوي رشته اي از مطالعات است كه در آن عقيده، احساس، ارزيابي، گرايش و هيجان مردم از زبان نوشتاري تحليل ميشود. نمونهاي از نظركاوي، نظركاوي ريزدانه جنبه گرا است كه در آن جنبههاي مهم يك قلم از متن نظر استخراج شده و جهتگيري هر جنبه بر اساس احساس ذكرشده تخمين زده ميشود. در اينجا هر جنبه ويژگي يا جزئي از يك قلم و جهتگيري همان ارزش عددي بيان كننده احساس كاربر است. ما در اين پژوهش با استخراج ويژگيهاي معنايي متن و استفاده از ميدان تصادف شرطي به عنوان مدل يادگير، جنبههاي نهفته در متن نظرات را استخراج كرديم. نتايج آزمايش ها نشان مي دهد كه روش مورد استفاده در اين پژوهش عملكردي قابل رقابت با بهترين روشهاي موجود روي مجموعه دادگان Semeval2014 دارد.
Thesis summary
-
رتبه بندي صفحات وب در جستجوي مفهومي به كمك روابط ساختاري و معنايي بين مفاهيم
مهنوش زندي 2016هدف از اين پژوهش، رتبه بندي صفحات وب با استفاده از اطلاعات مفهومي و معنايي بين مفاهيم مي باشد. يكي از روش هاي موثر و متداول رتبه بندي، مدل فضاي برداري است. درمدل فضاي برداري، اسناد به شكل بردارهايي هستند كه هر مولفه آن، وزن مربوط به واژه خاصي است. در اين مدل، واژگان با استفاده از روش هايي وزن دهي مي شوند. در صورت وجود واژه در سند متناسب با روش در نظر گرفته شده، وزن دهي شده و در صورت عدم وجود واژه در سند، وزن صفر مي گيرند. درصورتي كه مي دانيم واژگان مي توانند تعدادي معادل معنايي داشته باشند كه با مدل فضاي برداري، آنها در نظر گرفته نمي شوند . جهت رفع چنين نقطه ضعفي، تاكنون روش هاي جستجوي معنايي متعددي ارائه شده اند. يكي از اين روش هاي متداول، گسترش پرس وجو يا اضافه نمودن واژگان داراي معني مشترك با آن واژه به پرس وجو است. اين واژگان بايستي با دقت به معنا و مفهوم خود در متن زمينه آن واژه انتخاب شوند؛ در غير اينصورت تنها اثر آن منحرف ساختن بردار پرس وجو از بردار پرس وجوي بهينه است.
Thesis summary
-
كلاسه بندي تصاوير اثرانگشت با استفاده از ويژگي هاي سطح پايين تصوير
بهنام ختن لو 2016امروزه ويژگي هاي رفتاري و فيزيكي متعددي از انسان ها براي شناسايي آن ها به كار مي رود. مهم ترين مشخصه بيومتريكي كه براي تائيد يا تعيين هويت افراد به كار مي رود اثرانگشت است. افزايش تعداد افراد جوامع از يك سو و گسترش بانك هاي اطلاعاتي اثرانگشت از سوي ديگر، عمل شناسايي اثرانگشت به صورت سنتي را غيرممكن كرده و نياز به خودكار سازي عمل شناسايي اثرانگشت افزايش يافته است. در سيستم هاي خودكار تشخيص هويت كه بر اساس اثرانگشت كار مي-كنند، يك تصوير اثرانگشت ورودي بايد با كليه ي تصاوير موجود در پايگاه داده مقايسه شود كه اين كار بسيار وقت گير و پرهزينه است. درنتيجه نخستين مرحله در فرآيند شناسايي خودكار اثرانگشت، كلاسه بندي پايگاه داده مربوطه است.كلاسه بندي يك مجموعه بزرگ از تصاوير اثرانگشت به چندين زيرمجموعه، زمان جستجو و شناسايي يك تصوير اثرانگشت ناشناخته در آن مجموعه را به طور چشمگيري كاهش مي دهد. يك سيستم بازيابي مبتني بر محتوا معمولاً شامل دو بخش استخراج ويژگي و كلاسه بندي است. اولين مرحله روش پيشنهادي انجام پيش پردازش روي تصاوير پايگاه داده است. پس ازآن ويژگي هاي مختلف از تصاوير استخراج مي شوند. اولين ويژگي از تصويرِ جهت به دست مي آيد. ويژگي بعدي نيز از اعمال تبديل موجك بر روي تصويرِ جهت به دست مي آيد كه تصوير تا پنج سطح تجزيه شده و ضرايب موجك سطوح دوم تا پنجم به عنوان ويژگي به كار مي روند. اين ويژگي ها با استفاده از كلاسه بند شبكه عصبي پرسپترون چندلايه به پنج كلاس مارپيچي ، كماني ، كماني شكسته ، حلقه ي چپ ، حلقه ي راست تقسيم مي شوند. معيار دقت، براي ارزيابي سيستم پيشنهادي به كاررفته است. پياده سازي روش مذكور بر روي پايگاه داده Nist و نتايج آزمايش ها و مقايسه آن ها با كارهاي پيشين انجام شده در زمينه كلاسه بندي تصاوير اثرانگشت، حاكي از كارايي بالاي روش پيشنهادي هستند.
Thesis summary
-
شناسايي و دستهبندي ترافيك رمز شده TOR به كمك روشهاي يادگيري ماشين
محمدحسن مجتهدسليماني 2016شناسايي و دستهبندي ترافيكهاي شبكه بر اساس نوع نرمافزار براي كارهاي مختلف كنترلي و نظارتي شبكه همانند ايجاد صورتحساب، كيفيت خدمات، نظارت بر ترافيك شبكه و مهندسي ترافيك بسيار اهميت دارد. اين موارد كنترلي و نظارتي نيازمند اين هستند كه بدانند چه نوع ترافيكي در حال عبور از شبكه است تا با توجه به خط مشي از پيش تعريف شده اي، قانون يا قوانيني را بر ترافيك موردنظر اعمال نمايند. امروزه بسياري از نرمافزارهاي شبكه به دلايل مختلفي همچون محرمانگي داده، احراز هويت و مواردي ديگر از رمزنگاري استفاده ميكنند. اين نرمافزارها علاوه بر رمز كردن دادههايشان، معمولا از درگاههاي تصادفي غير مشهور بهره ميبرند. ازاين جهت، روشهاي شناسايي و دستهبندي ترافيكهاي اينترنتي همانند روشهاي مبتني بر درگاه و مبتني بر محتوا نميتوانند براي شناسايي اين ترافيكها مورد استفاده قرار بگيرند. بنابراين ضروري است از روشهاي ديگري بهره گرفته شود كه روشهاي يادگيري ماشين ميتوانند در اين زمينه بسيار سودمند باشند. روشهاي يادگيري ماشين براي شناسايي نرمافزارهاي شبكه، بر اساس اطلاعات آماري در هر جريان عمل ميكنند. اين اطلاعات آماري از ويژگيهاي مستقل از محتوا همانند اندازه بسته، فاصله زماني بين ورود بستهها و غيره نشات ميگيرند. در اين پژوهش، ترافيك رمز شده TOR (ترافيك افزونههاي Obfs3 و Scramblesuit) با استفاده از اين روشها مورد شناسايي و دستهبندي قرار ميگيرد. بدين منظور از شش الگوريتم يادگيري ماشين و 40 ويژگي آماري استفاده شده است. براي اينكه بتوانيم به صورت آنلاين ترافيك TOR را از ترافيكهاي پسزمينه شناسايي كنيم، از چند بسته ابتدايي جريان استفاده ميكنيم. در ابتدا جريانها را با استفاده از 40 ويژگي آماري دستهبندي ميكنيم و سپس به منظور كاهش تعداد ويژگيهاي استفادهشده، دستهبندي با استفاده از حداقل 8 و حداكثر 12 ويژگي انجام ميشود. نتايج به دست آمده حاكي از آن است كه ميتوان به خوبي ترافيك TOR را با استفاده از چند بسته ابتدايي جريان شناسايي كرد.
Thesis summary
-
كاهش نويز و بهسازي گفتار با استفاده از اطلاعات زباني و مشخصات گوينده
فريدون علينقي ها 2015گفتار ابزار اوليه ارتباط بين انسان هاست. انسان ها به كمك گفتار، مفاهيم متفاوتي را به مخاطبان خود انتقال مي دهند. همچنين گفتار ابزاري مناسب براي انتقال دانسته ها، انتقال مفاهيم ذهني و احساسات دروني نيز به حساب مي آيد. برتري بارز گفتار بر نوشتار متناظر با آن اين است كه گفتار اطلاعات جانبي بيشتري را به شنونده انتقال مي دهد كه بعضا هدف اصلي بيان جملات نيز انتقال همين اطلاعات است. يكي ديگر از ويژگي هاي بارز گفتار، سهولت انتقال آن به مخاطب است. سيگنال گفتار، سيگنال زماني يا نگاشتي است از فشار هوايي كه با ميكروفون احساس مي شود. براي اينكه سيگنال ضبط شده كيفيت مناسب داشته باشد طبق قضيه نايكوئيست بايد حداقل دو برابر ماكزيمم فركانس موجود در سيگنال، نمونه-برداري شود. سيگنال گفتار، سيگنال نا ايستان بوده و خواص آماري آن در طول زمان تغيير مي كند. به همين دليل تحليل سيگنال در بازه هاي كوتاه انجام مي شود. بهسازي گفتار بسته به مساله، هدف آن، ويژگي هاي نويز و امكانات موجود قابل بررسي است. از اين رو روش هاي متفاوتي جهت بهسازي سيگنال گفتار ارائه شده است، كه مواردي نظير فيلتر وينر، فيلتر وفقي، تفريق طيفي، روش هاي مبتني بر تبديل موجك و روش هاي آماري را مي توان نام برد. هيچ كدام از روش هاي بهسازي گفتار ارائه شده تا كنون قادر به كاهش يا حذف نويز به صورت موثر و در همه شرايط نويزي نيستند و همه روش ها فقط از خود سيگنال براي حذف نويز استفاده مي-كنند و براي بهبود گفتار اطلاعات زباني و مشخصات گوينده را در نظر نمي گيرند. اطلاعات زباني و مشخصات گوينده، دو ويژگي مهم از گفتار هستند كه گفتار را از نويز متمايز مي كنند. در اين پايان نامه، روشي پيشنهاد شده است كه بدون نياز به اطلاعات پيشين درباره ماهيت نويز، اين دو ويژگي را از سيگنال گفتار استخراج نموده و بر اساس آن ها به بهسازي گفتار مي پردازيم. با توجه به گفتار نويزي، رويكرد جديد گفتار تميز را از طريق شناسايي بخش هاي طولاني مجموعه كلي تخمين مي زند. در بازشناسي از جملات گفتار تميز پيكره كه شناسايي شده به عنوان نمونه استفاده مي شود؛ تطابق بين بخش هاي جمله نويزي و جملات پيكره شناسايي مي شود. تخمين نيز با بخش هاي مطابقت يافته طولاني شكل مي گيرد. تطابق بخش هاي طولاني تر، اطلاعات زباني و مشخصات گوينده قوي تري نسبت به بخش هاي گفتار كوتاه تر دارد. بنابراين، ت
Thesis summary
-
روشي انرژي آگاه براي مهندسي ترافيك درون دامنه اي به كمك روش هاي اكتشافي
سپيده زارعي 2015در روشهاي معمول مهندسي ترافيك، تمامي مسيريابهاو پورتهاي مختلف آنها، صرفنظر از ميزان بار ورودي به شبكه هميشه فعال بوده و بنابراين انرژي مصرف ميكنند. از طرفي ميانگين بهره وري لينكها در شبكه هاي ارائه دهنده خدمات اينترنتي تقريبا پايين بوده و حداكثر در حدود 30 تا 40 درصد است. بر همين اساس، هدف روشهاي مهندسي ترافيك انرژي آگاه اين است كه بر اساس وضعيت بار موجود بر روي لينكها و نيز حجم تقاضاي ورودي، مسيرهاي هدايت داده را به نحوي تغيير دهند كه بتواند برخي گرهها/لينكهاي كم ترافيك را خاموش نموده و بار تخصيص يافته به آنها را بر روي مسيرهاي ديگر قرار دهد تا از اين رهگذر انرژي مصرفي كل شبكه را كاهش دهد. در اين پايان نامه، پس از ارائه چند الگوريتم مهندسي ترافيك انرژي آگاه، در نهايت يك روش اكتشافي براي مهندسي ترافيك انرژيآگاه در شبكههاي درون دامنهاي ارائه ميدهيم. در روش پيشنهادي ابتدا لينكها به ترتيب بهره وري آن ها و انديسي كه به هر لينك متناسب با ميزان تأثير خاموش كردن آن در انرژي مصرفي داده ايم، مرتب مي شوند. سپس، لينك هاي مرتب شده به ترتيب براي غيرفعالسازي موقت آزمايش مي شوند. نتايج شبيهسازي در شبكه Abilene و Extended Abilene به همراه انواع مختلفي از ماتريس ترافيك واقعي نشان مي دهد كه مي توان تعدادي از گره هاي مياني و لينك ها را، با رعايت تضمين كيفيت سرويس، در زماني كه ترافيك حجم كم يا متوسطي دارد، خاموش كرده و انرژي مصرفي را تا حدود 35 درصد ذخيره نمود.
Thesis summary
-
روشي انرژي آگاه براي مهندسي ترافيك درون دامنه اي به كمك روش هاي هوش محاسباتي
مجتبي صباحي عزيز 2015مهندسي ترافيك انرژي آگاه، به دنبال تخصيص بارهاي ترافيكي به منابع است. اين تخصيص بايد به نحوي باشد كه برخي تجهيزات كم ترافيك خاموش شوند و بار مربوط به آن ها از مسيرهاي ديگر انتقال يابد. خاموش كردن اين تجهيزات، صرفه جويي انرژي را در پي خواهد داشت. در اين پايان نامه، يك روش مبتني بر الگوريتم هاي ژنتيك براي مهندسي ترافيك انرژيآگاه در شبكههاي درون دامنهاي ارائه ميدهيم. در روش پيشنهادي هر كروموزوم معادل يك توپولوژي است و ژن هاي كروموزوم معادل گره هاي مياني و لينك هاي توپولوژي هستند. كروموزوم هاي جديد از كروموزوم هاي قبلي بدست مي آيند تا در نهايت به كروموزومي دست يابيم كه ژن هاي غيرفعال بيشتري دارد. كروموزومي با اين خصوصيت معادل توپولوژي اي با مصرف انرژي بهينه خواهد بود. اين توپولوژي زماني مورد قبول خواهد بود كه محدوديت بهره وري بيشينه لينك را نيز لحاظ مي كند. نتايج شبيهسازي در شبكه Abilene و Extended Abilene به همراه انواع مختلفي از ماتريس ترافيك واقعي نشان مي دهد كه مي توان تعدادي از گره هاي مياني و لينك ها را، با تضمين كيفيت سرويس ، در زماني كه ترافيك حجم كم يا متوسطي دارد، خاموش كرده و انرژي مصرفي را تا حدود 40 درصد ذخيره نمود.
Thesis summary
-
تشخيص تقلب متون علمي به كمك روابط معنايي و ساختاري
زهرا طاهري 2015يكي از معضلات موجود در عصر حاضر مبحث تقلب متون است. افراد بسياري با استفاده از نوشته جات ديگران براي خود مطالبي تهيه و به نام خود ارائه مي دهند. تشخيص تقلب مي تواند ما را در بررسي صداقت آنان ياري نمايد. تقلب متون به شكل هاي مختلفي چون كپي و جايگزيني، بازگرداني، كپي و ادغام از منابع مختلف، درج متن اضافي، ترجمه، نقل قول، دادن مرجع اشتباه، سرقت ايده و خلاصه سازي باشد. آشكارسازي تقلب توسط روش ها و الگوريتم هايي بسياري پيگيري مي شود كه هر كدام با بهره گيري و بررسي متن از جنبه هاي مختلف در صدد شناسايي شباهت متون برآمده اند. مي توان روش ها را در روش هاي مبتني بر شباهت رشته اي، مبتني بر خوشه بندي، مبتني بر ساختار و قالب متن، مبتني بر نحو، مبتني بر معنا، مبتني بر بردار، مبتني بر منطق فازي و غيره دسته بندي نمود. در اين پايان نامه يك روش مبتني بر ساختار و نحو و دو روش مبتني بر معنا معرفي شده اند. در روش ساختاري از LexParser براي مشخص نمودن وابستگي نحوي بين كلمات استفاده شده است، تعداد وابستگي مشترك را استخراج نموده و شباهت حاصل مي شود.در روش هاي مبتني بر معنا از پايگاه داده وردنت استفاده شده است. (وردنت پايگاه داده اي شامل مفاهيم انگليسي و روابط معنايي بين آن ها است. در اين پايگاه داده روابط معنايي عام و خاص، جز و كل، استلزام، عليت، شباهت، تضاد، هم چنين، خصلت، گروه بندي افعال، اشتقاق، وجه وصفي، صفت وابسته، دامنه و عضو دامنه، Domain و Member تعريف شده است). در روش پيشنهادي اول، كلمات دو جمله را در وردنت پيدا مي كنيم سپس اجداد آن ها را با توجه به رابطه Hypernym، پدران كلمات مشخص مي شود، در ادامه اولين پدر مشترك كلمات را پيدا نموده با توجه به فاصله كلمه از پدر مشترك و تعداد اجداد مشترك شباهت كلمات تعيين مي گردد. حال با استفاده از الگوريتم DTW مي توان شباهت دو جمله را مشخص نمود. نتايج آزمايش روش هاي پيشنهادي و مقايسه آن با ساير روش ها حاكي از كارايي روش پيشنهادي دارد.در روش معنايي پيشنهادي دوم ما به هر كدام از روابط معنايي موجود در وردنت، عددي اختصاص داده ايم. اين اعداد ميزان نزديكي يا تفاوت معنايي آن ها را بيان مي كند، براي مثال به رابطه تشابه عدد كوچك و به رابطه تضاد عدد بزرگتري اختصاص داده ايم. حال بعد از دريافت ورودي كلمات جمله ها را از لحاظ روابط معنايي بررسي كرده و نتايج را
Thesis summary
-
فراهم آوري امكان پشتيباني از كيفيت سرويس در لايه دسترسي به رسانه شبكه هاي حسگر بيسيم مبتني بر استاندارد IEEE 802.15.4
حسين نوري 2014استفاده از شبكه هاي حسگر بيسيم امروزه بسيار رواج يافته و اكنون اين شبكه هاكاربردهاي متنوع و وسيعي دارند. هر كدام از اين كاربردها، بسته به نيازمندي هاي خود درجات مختلفي از تضمين كيفيت سرويس را طلب مي كنند.راهكارهاي بسياري جهت فرآهم آوري كيفيت سرويس در لايه هاي مختلفِ پروتكل هاي مربوط به شبكه هاي حسگر ارائه شده است. استاندارد IEEE 802.15.4 بعنوان يكي از پركاربردترين آن ها با استفاده از مكانيزمهاي غير رقابتي سعي در ارائه درجاتي از كيفيت سرويس دارد كه آن هم محدوديت هاي خاص خود را دارد.در اين پايان نامه روشي مبتني بر بهبود مكانيزم هاي مورد استفاده در اين استاندارد در لايه دسترسي به رسانه ارائه شده كه از مزاياي هر دو مُد رقابتي و غير رقابتي آن استفاده مي كند.ارزيابي نتايج شبيه سازي نشان مي دهد كه روش ارائه شده روشي كارآمد بوده كه قادر به فراهم آوري پشتيباني از كيفيت سرويس در شبكه هاي حسگر است.
Thesis summary
-
جمع آوري داده با چاهك متحرك در شبكه هاي حسگر بي سيم
آرام حسيني 2014با رشد و توسعه فناوري شبكه هاي حسگر بي سيم، استانداردهاي 802.15.4 و RPL به منظور همگن سازي پروتكل هاي ارتباطي در اين شبكه ها ارائه شده اند. براي جمع آوري داده در برخي كاربردهاي شبكه هاي حسگر، بسته هاي حاوي داده توسط گره ها به سمت چاهك ساكن هدايت مي شوند. با اين حال در بسياري كاربردهاي ديگر، چاهك در محيط حركت مي كند و داده ها را از گره هايي كه از كنارشان مي گذرد جمع آوري مي كند. با توجه به استقبال از استانداردهاي فوق الذكر براي شبكه-هاي حسگر بي سيم و نياز آنها به نگهداري هم بندي شبكه با محوريت چاهك، بررسي تاثير تحرك چاهك در پارامترهاي كارايي شبكه حسگر اهميت دوچندان مي يابد. بنابراين در اين پايان نامه، اين مساله را بررسي نموده و با يك سناريوي پيشنهادي نشان مي دهيم كه چاهك متحرك، با سرعت كنترل شده، مي تواند ميانگين طول عمر شبكه را افزايش داده و توازن را در مصرف انرژي بين گره هاي حسگر ايجاد كند.
Thesis summary
-
استخراج خودكار رده بندي مفاهيم از متون بدون ساختار با استفاده از روش هاي هوشمند پردازش متن
حسين سبزياني 2013استخراج اطلاعات ساخت يافته از متون بدون ساختار يكي از زمينه هاي رايج پردازش زبان هاي طبيعي است كه از همان ابتداي پيدايش پردازش زبان هاي طبيعي مورد توجه پژوهشگران اين زمينه بوده است. روش هاي زيادي وجود دارند كه به استخراج اطلاعات از متون بدون ساختار مي پردازند، ولي تعداد كمي از اين روش ها به تركيب اين اطلاعات و ساخت يك منبع دانش ساخت يافته پرداخته اند. در اين پايان نامه روشي براي براي ساخت گراف شمول معنايي از يك متن بدون ساختار ارايه داده شده است. گراف شمول معنايي گرافي است كه راس هاي آن مفاهيم كليدي موجود در متن و يالهاي آن بيانگر وجود رابطه شمول معنايي بين دو مفهوم مي باشد. رابطه شمول معنايي به رابطه ي بين دو مفهوم گفته مي شود كه در آن يكي از مفاهيم از لحاظ معنايي شامل مفهوم ديگر باشد. رابطه شمول معنايي به دو دسته كل-جز و عام-خاص تقسيم مي شود، رابطه كل -جز به رابطه اي گفته مي شود كه در آن يكي از مفاهيم جزي از مفهوم ديگر باشد مانند رابطه بين "تيم" و "بازيكن" . رابطه ي عام خاص به رابطه ي گفته مي شود كه در آن يكي از مفاهيم از لحاظ معنايي شامل مفهوم ديگر باشد مانند رابطه "كامپيوتر" و "هوش مصنوعي". در اين پايان نامه روش استخراج گراف شمول معنايي از متون بدون ساختار از چند مرحله تشكيل شده است كه به صورت زير مي باشند: - پيش پردازش پيكره متني ورودي - استخراج مفاهيم كليدي از پيكره متني ورودي - استخراج روابط شمول معنايي با استفاده از مفاهيم كليدي استخراج شده - رفع ابهام معنايي از روابط استخراج شده - وزن دهي به روابط شمول معنايي و ساخت گراف اوليه - پيرايش گراف - تكميل كردن گراف با استفاده از استخراج روابط شمول معنايي از صفحات وب در كارهاي قبلي گراف شمول معنايي، با استفاده از كلمات موجود در متن ساخته شده است ولي در اين پايان نامه گراف شمول معنايي بر اساس معاني كلمات ساخته مي شود. در اين پايان نامه يك روش جديد براي ساخت گراف و همچنين استخراج روابطي كه صراحتا در متن وجود ندارند ارايه شده است. نتايج بدست آمده در اين پايان نامه بيانگر اين است كه منابع دانش رده بندي لغوي (مانند وردنت) كه به صورت دستي ساخته شده است را مي توان به صورت خودكار استخراج كرد.
Thesis summary
-
بررسي جامع قابليت برازش مدل هاي مختلف منحني توزيع اندازه ذرات خاك و منحني مشخصه آب خاك بر داده هاي تجربي در كلاس هاي بافتي متفاوت
مصطفي راستگو 2013 -
ساخت پيكره ي متني فارسي حوزه ي فاوا
شكوفه دشتباني 2013در زبانشناسي رايانه اي پيكره، انباره اي از داده هاي متني است كه براي اهداف مختلفي مثل مطالعات فرهنگي يك زبان خاص، مطالعه تغييرات يك زبان با گذشت زمان، پروژه هاي پردازش زبان هاي طبيعي، پروژه هايي كه مربوط به حوزه ي زبان شناسي است، ايجاد مي شوند. در اين تحقيق تمركز ما بر طراحي و ساخت پيكره ي دو زبانه ي فارسي-انگليسي حوزه ي فاوا است. اين پيكره به صورت خودكار ساخته شده است و منابع آن اسناد تخصصي حوزه ي فاوا است. در اين پژوهش نرم افزاري براي ساخت پيكره طراحي شده است كه هزينه و مدت زمان ساخت پيكره را كاهش مي دهد علاوه بر اين، نرم افزار ارائه شده قابليت مديريت پيكره را نيز براي كاربران فراهم مي كند. از ويژگي هاي پيكره ي ساخته شده فراهم كردن يك مجموعه ي متمركز از اسناد تخصصي است كه مي تواند در پروژه هاي مختلف حوزه ي فاوا استفاده شود. مهمترين مرحله ي ساخت پيكره-هاي چند زباني ترازبندي داده هاي پيكره است. در اين پروژه روشي براي ترازبندي جمله هاي پيكره ي فارسي تخصصي حوزه فاوا ICT و جملات انگليسي پيكره ي تخصصي حوزه فاوا ارائه شده است. هدف اين پژوهش طراحي يك سيستم ترازبندي براي استخراج جمله هاي متناظر دو زبان است. در اين روش با استفاده از يك لغت نامه دو زباني كه ايجاد كرده ايم و تكنيك هاي هوش مصنوعي، امتياز نشان دهنده شباهت دو جمله، محاسبه مي شود. در نهايت اطلاعات مربوط به نگاشت جمله-هاي دو مجموعه ي انگليسي و فارسي در پايگاه داده ي پيكره ذخيره مي گردد. آزمايش ها نشان مي دهد كه اين تكنيك علاوه بر اينكه از نظر دقت مناسب است، تعداد جمله هاي كانديد را نيز كاهش مي دهد. در انتها آماري از وضعيت فعلي پيكره ي فاوا ارائه مي شود.
Thesis summary
-
تشخيص احساس از روي گفتار پيوسته فارسي
مينا حميدي 2012در سال هاي اخير بازشناسي احساس به عنوان روش جديدي براي تعامل انسان با كامپيوتر مورد توجه و موضوع تحقيقات زيادي بوده است. احساس، در قالب حركات چهره، گفتار، حركات دست و بدن و علايم زيستي مانند ضربان قلب بروز مي يابد. مدل پيشنهادي در اين پايان نامه از گفتار پيوسته فارسي براي بازشناسي احساس استفاده مي كند. بازشناسي احساس از گفتار بر روي زبان هاي مختلفي انجام شده اما بر روي زبان فارسي تا كنون اين چنين به آن پرداخته نشده است. براي ارزيابي عملكرد سيستم طراحي شده، نياز به پايگاه داده مناسبي داشتيم. به علت نبود پايگاه داده مناسب اقدام به ساخت و تهيه پايگاه داده صوتي احساسي نموده و آن را BASU Speech database نام نهاديم. اين پايگاه داده از صداي ضبط شده بازيگران در سريال ها و فيلم هاي تلوزيوني و نمايشنامه هاي راديويي ساخته شده است. هدف طبيعي بودن و جامع بودن گفتار موجود در پايگاه داده بود كه به همين خاطر در اين پايگاه از گفتار زن و مرد و در رده هاي مختلف سني استفاده شده است. در اين مدل ابتدا ويژگي هاي مورد نياز گفتار را استخراج كرده و با استفاده از سه طبقه بند شبكه عصبي، SVM و بيز به بازشناسي احساس از گفتار پرداخته شده و نتايج به دست آمده مقايسه و تحليل شده است. در اين پايان نامه سه آزمايش متفاوت ترتيب داده شده است. آزمايش اول و دوم به بازشناسي احساس تنها يك فرد پرداخته، با اين تفاوت كه در آزمايش اول هر احساس به صورت جدا بررسي شده اما در آزمايش دوم هر پنج احساس مورد نظر مورد بررسي قرار گرفته شده است. اما آزمايش سوم بر روي كل پايگاه داده تهيه شده، انجام گرفته است. بر اساس نتايج به دست آمده، بازشناسي احساس از گفتار براي يك شخص خاص نتايج بهتري از خود نشان خواهد داد، علاوه بر اين هر چه تعداد احساس مورد بررسي بيشتر شود، احتمال نزديك شدن آنها به هم و پايين آمدن دقت بيشتر خواهد شد. در آزمايشات انجام شده طبقه بند بيز دقت بالاتري براي بازشناسي احساس از گفتار بدست آورده است. با مقايسه نتايج بدست آمده در اين تحقيق با كارهاي ديگري كه در اين زمينه انجام شده اند، دقت به دست آمده در آزمايشات انجام شده در اين پايان نامه كه به صورت ميانگين براي سه طبقه بند شبكه عصبي، SVM و بيز به ترتيب،6.69%، 4.71% و 78% مي باشد، نتايج قابل قبولي خواهند بود.
Thesis summary