2021-04-29-Thu-StudyKR

» studyKR

RL Summary

강화학습은 바둑과 같이 특정 규칙과 보상이 있는 상황인 경우 매우 적합한 딥러닝 모델이 된다. 
강화학습의 경우, 굳이 노력이 많이 드는 학습 데이터를 직접 만들 필요가 없이, 
	규칙과 보상 알고리즘만으로 학습 데이터를 자동 생성할 수 있다.
	
DQN은 replay memory를 이용하여 state,action,reward, next state의 정보를 memory에 저장하고, 
	이 정보를 이용하여 convolutional neural network라는 딥러닝 모델을 사용하여 좋은 action을 선택하게하는 알고리즘 입니다.

git Commit

Commit 만족 조건
1. 커밋한 이메일 주소와 깃허브 이메일 주소가 같아야함
2. standalone repository여야한다. 즉 fork한 파일이면 커밋이 되지 않는다.
	fork 한 파일 안의 내용을 추가하여도 커밋 조건이 만족하지 않는다.