메뉴바로가기
메인메뉴 바로가기
컨텐츠 바로가기
 Loading... 

컨텐츠

교육과정 상세보기

교육과정 상세보기

Python을 이용한 강화학습

교육정보
교육 일정
교육 개요
교육 목적
교육 기간 3일(21시간)
교육비 1,500,000 원
교재 (-)
선수 지식
교육 대상
교육 내용
1일차
- Intro
- 기반기술
딥러닝 (TensorFlow & PyTorch)
MDP
- Agent 기술
OpenAI Gym API
- Q-Learning (1)
Q-table과 Bellman방정식
SARSA, DQN (Deep Q-Networks)

2일차
- Q-Learning (1)
DQN의 확장
- 혼합기법
Policy-Gradient
A2C (Advantage Actor-Critic)

3일차
- PPO
Proximal Policy Optimization
- 환경설계
States, Action 및 Reward (Action Space)
- Wrap-up


수강후기