یادگیری تقویتی ترکیبی مبتنی بر مدل جهت مدیریت انرژی سیستم های گرمایش و تهویه مطبوع - دانشکده فنی و مهندسی
یادگیری تقویتی ترکیبی مبتنی بر مدل جهت مدیریت انرژی سیستم های گرمایش و تهویه مطبوع
نوع: Type: رساله
مقطع: Segment: دکتری
عنوان: Title: یادگیری تقویتی ترکیبی مبتنی بر مدل جهت مدیریت انرژی سیستم های گرمایش و تهویه مطبوع
ارائه دهنده: Provider: سرور مؤید داود الصالح - رشته برق
اساتید راهنما: Supervisors: دکتر علیرضا حاتمی و دکتر رعد زعلان حمود
اساتید مشاور: Advisory Professors:
اساتید ممتحن یا داور: Examining professors or referees: دکتر محمد حسن مرادی, دکتر کاظم زارع و دکتر محمد عابدینی
زمان و تاریخ ارائه: Time and date of presentation: 1401/4/5 یکشنبه ساعت 12 تا 14
مکان ارائه: Place of presentation: کلاس 10
چکیده: Abstract: هدف اصلی سیستم کنترل گرمایشی، تهویه مطبوع و بهینه سازی هوا (HVAC)؛ کاهش مصرف انرژی همراه با فراهم سازی شرایط داخلی مطلوب است. روشهای مختلفی برای مدل سازی HVAC در این رساله بحث شده است. علاوه بر این، یک بررسی جامع از روش های کنترلی سیستم های HVAC ارائه شده است. پس از آن، روش های کنترلی طبقه بندی می شوند و مزایا، معایب و ویژگی های اصلی هر یک مشخص می گردد. روش های کنترلی یادگیری ماشینی (ML) که در سیستم های HVAC برای کنترل دمای داخلی یا غلظت CO2 ساختمان ها کاربرد دارد، به دلیل توانایی درکنترل مصرف انرژی و به حداقل رساندن هزینه های انرژی، پیک بار شبکه و ارائه خدمات جانبی مانند تنظیم فرکانس، بررسی شده است. یک مدل اصلاح شده از سیستم HVAC به صورت همراه با و بدون کنترل کننده Takagi – Sugeno Fuzzy (TSF) ساخته شده است تا عملکرد آن در مقایسه با مدل ضریب بار مسکونی (RLF)مقایسه شود. نتایج حاصل از مقایسه مدل پیشنهادی و مدل RLF نشان می دهد که مدل پیشنهادی نسبت به مدل خنک کننده کویل دوبلRLF با صرفه جویی در انرژی در حدود 06.10 % کارآمدتر و پایدارتر است. کاهش میزان مصرف انرژی و حفظ سطح رفاه کاربران برای تنظیم دمایی و کیفیت هوای داخلی؛ دو فاکتور مهمی است که باید در ارزیابی عملکرد محیط کار جدید مورد توجه قرار گیرد. بنابراین، یک سیستم جدید تهویه مطبوع با در نظر گرفتن دما و غلظت CO2 به عنوان حالت های پیوسته در یک مدل یکپارچه، با استفاده از قوانین حفظ انرژی و مدل سازی چند جمله ای لاگرانژ بر اساس قانون حفظ جرم توسعه یافته است. سپس معماری آنلاین یادگیری تقویتی (RL)مبتنی بر مدل (MB) که قابلیت اعمال تصمیمات بهینه را برای روشن / خاموش کردن سیستم تهویه مطبوع، روشنایی، باز/ بستن سیستم درها، پنجره ها و نسبت های میراگر هوای تازه / برگشتی برای ایجاد یک محیط کار هوشمند را دارد، ارائه و در مدل سیستم جدید HVAC اعمال شده است. در هر لحظه، سیستم کنترلی اطلاعات دمای فضای خارجی / داخلی و غلظت CO2 را دریافت می کند و سپس با بهترین اقدامات کنترلی پاسخ می دهد که امکان ایجاد تغییرات در شرایط محیط را برای کاربران مورد نظر فراهم می کند. سیاست قطعی (DP) همراه با روش یادگیری تقویتی مبتنی بر مدل (MB-RL) برای تهیه یک روش DP-MB-RL ترکیب شده است تا امکان تجزیه و تحلیل عملکرد سیستم از نظر سطح رضایت ساکنین ساختمان و صرفه جویی در انرژی فراهم شود. با این حال، برای بهینه سازی کنترل سیستم HVAC، از تغذیه پیشخور زنجیره ای عمیق (CF) و سپس شبکه عصبی برون ریز خودکار رگرسیون غیرخطی (NARX) به عنوان توابع تقریبی برای روش کنترلی DP-MB-RL استفاده شده است. رویکرد ترکیبی عمیق CF-RL وترکیبی عمیق NARX-RL از مزایای CF و NARX مانند پیش بینی بالا، تقریب توابع و تعمیم با تصمیم گیری مطلوب RL بهرمند است. الگوریتم های بهبود یافته برای ساختار شبکه های DP-MB-RL ، ترکیبی DDP-CF-RL و DDP-NARX-RL عملکرد خوبی در کنترل دمای داخلی و سطح غلظت CO2 در مقایسه با روش MB-RL دارند. اما روش DDP-NARX-RL به دلیل توانایی درشناسایی فضاهای پیوسته- عمل و آموزش داده های زیاد در کوتاهترین زمان، در مقایسه با سه روش کنترلی دیگر بهترین عملکرد را دارد. همچنین، عملکرد و پاسخگویی سیستم HVAC بدون هیچ گونه نوسان، فراجهش / فروجهش و رفع اختلال بهبود یافته است. علاوه بر این، مصرف انرژی یک ساختمان با استفاده از چهار روش DP-MB-RL ، MB-RL, DDP-CF-RL و DDP-NARX-RL در طول روز ارزیابی می شود. نتایج نشان داد که DDP-NARX-RL به صرفه جویی در انرژی تا حد 5.20 % در مقایسه با روش MB-RL و 5.6 % در مقایسه با روشDP-MB-RL دست یافته است. با استفاده از روش های DDP-CF-RL و DP-MB-RL در مقایسه با MB-RL، مصرف انرژی ساختمان در طول یک روز به ترتیب 25.17٪ و 031.15٪ به مقدار قابل توجهی کاهش یافته است. علاوه بر این، هزینه های انرژی سیستم برای چهار کنترل کننده بر اساس طرح های مختلف قیمت گذاری برق و بارهای کویل خنک کننده سیستم محاسبه و ارزیابی شده است. نتایج نشان میدهد که کنترلکننده DDP-NARAX-RL عملکرد بهتری نسبت به سایرین دارد، زیرا سیستم با کاهش هزینههای برق در پایینترین طرح های قیمت ثابت (FP)، قیمتگذاری زمان استفاده (TOU) و قیمتگذاری در زمان واقعی (RTP) کار میکند. علاوه بر این، DP-NARX-RL برای کنترل یک سیستم چندگانه HVAC به مدت 24 ساعت استفاده می شود و عملکرد آن با کنترل کننده های RL و PID از جنبه های مختلف مانند شرایط بهینه سازی حرارتی، مصرف انرژی و هزینه انرژی برای طرح های قیمت گذاری مختلف مقایسه می شود. نتایج نشاندهنده عملکرد بهتر کنترلکننده پیشنهادی در مقایسه با کنترلکنندههای معیار است. برنامه نرم افزاری MATLAB Simulink برای کارهای شبیه سازی ساختمان، مدل سیستم HVAC و کنترل کننده های مختلف استفاده می شود.
فایل: ّFile: تنزيل فایل