1. | 강화학습 개요 | 강화학습 개요 | ||
2. | Markov Decision Process | Markov Decision Process | ||
Markov Decision Process | Markov Decision Process | |||
3. | Bellman Equation | Bellman Expectation Equation | ||
Bellman Equation | Bellman Expectation Equation | |||
Bellman Equation | Bellman Optimality Equation | |||
4. | Dynamic Programming | Dynamic Programming | ||
Dynamic Programming | Policy Iteration | |||
Dynamic Programming | Value Iteration | |||
5. | Prediction & Control | Monte Carlo, Temporal Difference | ||
Prediction & Control | SARSA, Q-learning | |||
6. | Perceptron | Perceptron | ||
신경망 기초 | 신경망 기초 | |||
신경망 기초 | 신경망 기초 | |||
7. | 신경망 기초 | 신경망 기초 | ||
신경망 기초 | 신경망 기초 | |||
신경망 학습 - 수치미분 | 신경망 학습 - 수치미분 | |||
신경망 학습 - 수치미분 | 신경망 학습 - 수치미분 | |||
8. | 신경망 학습 - 수치미분 | 신경망 학습 - 수치미분 | ||
신경망 학습 - 수치미분 | 신경망 학습 - 수치미분 | |||
신경망 학습 - 오차역전파 | 신경망 학습 - 오차역전파 | |||
신경망 학습 - 오차역전파 | 신경망 학습 - 오차역전파 | |||
9. | 신경망 학습 - 오차역전파 | 신경망 학습 - 오차역전파 | ||
신경망 학습 - 오차역전파 | 신경망 학습 - 오차역전파 | |||
신경망 학습 - 오차역전파 | 신경망 학습 - 오차역전파 | |||
Convolutional Neural Network | Convolutional Neural Network | |||
Convolutional Neural Network | Convolutional Neural Network | |||
Convolutional Neural Network | Convolutional Neural Network | |||
Convolutional Neural Network | Convolutional Neural Network | |||
10. | DQN (Deep Q-Network) | DQN (Deep Q-Network) | ||
DQN (Deep Q-Network) | DQN (Deep Q-Network) | |||
11. | 정책 경사법 | 정책 경사법 | ||
정책 경사법 | Actor-Critic | |||
12. | 알파고 - 바둑기초 & 롤아웃 정책 | 알파고 - 바둑기초 & 롤아웃 정책 | ||
알파고의 딥러닝 | 알파고의 딥러닝 | |||
13. | 알파고의 강화학습 | 알파고의 강화학습 | ||
알파고의 강화학습 | 알파고의 강화학습 | |||
14. | 알파고의 MCTS | 알파고의 MCTS | ||
알파고 완성 | 알파고 완성 | |||
15. | 알파고 제로 | 알파고 제로 | ||
알파고 제로 | 알파고 제로 |