| مشخصات مقاله پاورپوینت انگلیسی | |
| عنوان فارسی مقاله | یادگیری تقویتی |
| عنوان انگلیسی مقاله | Reinforcement Learning |
| فرمت مقاله | پاورپوینت (PPT یا PPTX) |
| تعداد اسلایدها | 36 اسلاید |
| قابلیت ویرایش | دارد |
| قابلیت پرینت | دارد |
| رشته های مرتبط با این مقاله | مهندسی کامپیوتر |
| گرایش های مرتبط با این مقاله | هوش مصنوعی |
| کد محصول | EP368 |
دانلود رایگان پاورپوینت انگلیسی سفارش ترجمه این پاورپوینت
| تصویری از مقاله |
|
| بخشی از مقاله |
|
Explore/Exploit Tradeoff Can’t always choose the action with highest Q-value The Q-function is initially unreliable Need to explore until it is optimal Most common method: ε-greedy Take a random action in a small fraction of steps (ε) Decay ε over time There is some work on optimizing exploration Kearns & Singh, ML 1998 But people usually use this simple method
|
دانلود رایگان پاورپوینت انگلیسی سفارش ترجمه این پاورپوینت