귀차니스트

  • 홈
  • 태그
  • 방명록

Taxi 1

OpenAI gym을 이용해 Q-Learning 구현해보기

큐러닝의 경우 살사와 너무 유사해서 이번에는 다른 예제를 가지고 큐러닝을 해보자. 이번의 예제는 OpenAI gym의 Taxi-v1. 일단 Taxi-v1의 깃허브 코드를 보며 state와 action 등에 대해서 파악. Description 에피소드가 시작하면 택시는 랜덤한 위치에서 시작하고 승객은 랜덤한 location(위치, R,G,B,Y)에서 시작한다. 택시 드라이버는 승객의 위치로 가서 승객을 태우고 승객의 목적지로 간다. 여기서 목적지는 승객이 출발하는 위치를 제외한 나머지 위치 중 하나이다. 승객이 목적지에서 내리면 에피소드는 끝난다. observations 500개의 이산적인 states들이 있는데 25개의 taxi 위치, 승객의 위치(택시 안에 있는것도 포함) 5개 그리고 4개의 목적지를 ..

강화학습/OpenAI gym 2020.03.21
이전
1
다음
더보기
프로필사진

귀차니스트

  • 분류 전체보기 (44)
    • 비전 (2)
    • 안드로이드 (1)
    • 신경망 (0)
      • CNN (0)
    • 강화학습 (38)
      • Reinforcement Learni.. (14)
      • RL 강의 정리 (6)
      • RL Introduction 책 요약 (3)
      • OpenAI gym (9)
      • 논문리뷰 (2)
    • ETC (2)
    • 머신러닝 (1)

Tag

강화학습, ai, ValueIteration, Taxi, OpenAI gym, 인공지능, Reinforcement Learning, OpenAI, PolicyIteration,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/06   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바