귀차니스트

  • 홈
  • 태그
  • 방명록

OpenAI gym 1

OpenAI gym을 이용해 Deep SARSA 구현하기

이번에는 신경망을 사용할건데 새로운 gym 환경인 OpenAI gym의 CartPole-v1을 사용함. 그리고 tensorflow를 설치해서 사용. Deep SARSA의 경우 원래 구현했던 SARSA 알고리즘에서 state가 실제로 받을 값과 예측한 값을 신경망의 정답과 예측값으로 주어 학습시키는 방법임. 일단 카트폴 예제가 무엇인지 한번 보자. 바로 이런 카트와 폴이 있을 때 카트를 좌 우로 움직여 폴이 떨어지지 않게 하는게 카트폴 문제의 핵심이라고 할 수 있음. Observation 0 : 카트의 위치 1 : 카트의 속도 2 : 폴의 각도 3 : 폴의 각속도 상태는 위와 같이 4개가 있고 각 상태마다 제한된 min max값이 있음. 여기서 확인 Action 0 : 카트를 왼쪽으로 밀기 1 : 카트를 ..

강화학습/OpenAI gym 2020.03.23
이전
1
다음
더보기
프로필사진

귀차니스트

  • 분류 전체보기 (44)
    • 비전 (2)
    • 안드로이드 (1)
    • 신경망 (0)
      • CNN (0)
    • 강화학습 (38)
      • Reinforcement Learni.. (14)
      • RL 강의 정리 (6)
      • RL Introduction 책 요약 (3)
      • OpenAI gym (9)
      • 논문리뷰 (2)
    • ETC (2)
    • 머신러닝 (1)

Tag

PolicyIteration, 인공지능, ValueIteration, 강화학습, Taxi, OpenAI gym, Reinforcement Learning, ai, OpenAI,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/04   »
일 월 화 수 목 금 토
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바