پاورپوینت یادگیری تقویتی 79 اسلاید بخشی از فایل: یادگیری تقویتی از اینرو مورد توجه است که راهی برای آموزش عاملها برای انجام یک عمل از طریق دادن پاداش و تنبیه است بدون اینکه لازم باشد نحوه انجام عمل را برای عامل مشخص نمائیم. دو استراتژی اصلی برای اینکار وجود دارد: یکی استفاده از الگوریتم های ژنتیکی است که در آن در فضای رفتارها عملی جستجو میگردد که در محیط بتواند هدف مورد نظر را بر آورده نماید. و دیگری استفاده از روشهای آماری و dynamic programming در این درس روش دوم مد نظر است. ...