귀차니스트

  • 홈
  • 태그
  • 방명록

ValueIteration 1

OpenAI gym을 이용해 ValueIteration 구현하기

이번에는 OpenAI의 FrozenLake-v0를 이용해서 valueIteration을 구현해보자 import gym import numpy as np GAMMA=0.9 INIT_POLICY=[0.25,0.25,0.25,0.25] THRESHOLD = 1e-20 선언부는 별 차이가 없음 env = gym.make('FrozenLake-v0') FrozenLake 환경을 만들어주고 def value_iteration(env, policy): value_func = np.zeros(env.observation_space.n) after_value_func = np.copy(value_func) for t in range(1000): for state in range(env.observation_space.n..

강화학습/OpenAI gym 2020.03.08
이전
1
다음
더보기
프로필사진

귀차니스트

  • 분류 전체보기 (44)
    • 비전 (2)
    • 안드로이드 (1)
    • 신경망 (0)
      • CNN (0)
    • 강화학습 (38)
      • Reinforcement Learni.. (14)
      • RL 강의 정리 (6)
      • RL Introduction 책 요약 (3)
      • OpenAI gym (9)
      • 논문리뷰 (2)
    • ETC (2)
    • 머신러닝 (1)

Tag

ValueIteration, 강화학습, ai, PolicyIteration, 인공지능, OpenAI, Reinforcement Learning, OpenAI gym, Taxi,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/04   »
일 월 화 수 목 금 토
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바