مشخصات مقاله پاورپوینت انگلیسی | |
عنوان فارسی مقاله | یادگیری تقویتی |
عنوان انگلیسی مقاله | Reinforcement Learning |
فرمت مقاله | پاورپوینت (PPT یا PPTX) |
تعداد اسلایدها | 36 اسلاید |
قابلیت ویرایش | دارد |
قابلیت پرینت | دارد |
رشته های مرتبط با این مقاله | مهندسی کامپیوتر |
گرایش های مرتبط با این مقاله | هوش مصنوعی |
کد محصول | EP368 |
دانلود رایگان پاورپوینت انگلیسی سفارش ترجمه این پاورپوینت
تصویری از مقاله |
بخشی از مقاله |
Explore/Exploit Tradeoff Can’t always choose the action with highest Q-value The Q-function is initially unreliable Need to explore until it is optimal Most common method: ε-greedy Take a random action in a small fraction of steps (ε) Decay ε over time There is some work on optimizing exploration Kearns & Singh, ML 1998 But people usually use this simple method
|
دانلود رایگان پاورپوینت انگلیسی سفارش ترجمه این پاورپوینت