강화학습 Q값 > 수강생 질의응답 | 노승욱 국어

본문 바로가기

수강생 질의응답 수강생 질의응답

수강생 질의응답

수강생 질의응답

강화학습 Q값

작성자Littletree

등록일 25-11-01
조회344회

본문

파란색 별표 옆부분에 에이젼트가 (a) 에 도달하면 Q값이 변한다고 되어 있는데 저는 아래에 (a)에서 오른쪽으로 이동하여 G에 도달하면 보상값을 받아서 Q값이 변한다고 생각했는데 그게 그 의미인가요 아니면 (a) 값에 도달하는거 자체가 Q값을 변화기키는건가요?

댓글목록

임성은조교님의 댓글

임성은조교 작성일 25-11-02 16:33

a값에 도달하는 것 자체가 Q값을 변화시킵니다.
2문단에서 보면 Q값은 (보상값)+(바로 다음단계의 가능한 Q값중 가장 큰 값) 으로 정해집니다. a에 도달하면 보상값은 0이지만 (바로 다음단계의 가능한 Q값중 가장 큰 값)=1 이므로 a에서의 Q값은 1입니다.

목록