교육 일정 |
|
---|---|
교육 개요 | |
교육 목적 | |
교육 기간 | 3일(21시간) |
교육비 | 1,500,000 원 |
교재 | (-) |
선수 지식 | |
교육 대상 | |
교육 내용 |
1일차
- Intro - 기반기술 딥러닝 (TensorFlow & PyTorch) MDP - Agent 기술 OpenAI Gym API - Q-Learning (1) Q-table과 Bellman방정식 SARSA, DQN (Deep Q-Networks) 2일차 - Q-Learning (1) DQN의 확장 - 혼합기법 Policy-Gradient A2C (Advantage Actor-Critic) 3일차 - PPO Proximal Policy Optimization - 환경설계 States, Action 및 Reward (Action Space) - Wrap-up |
수강후기 |
|