강화학습
-
강화학습|Mujoco 설치 및 학생용 무료 계정으로 사용하기 (MacOS)Reinforcement Learning/Environments 2020. 6. 21. 04:45
#Mujoco #강화학습 #환경설정 #Reinforcement Learning #Mac #MacOS 안녕하세요! 오늘은 강화학습을 구현할 때 많이 사용되는 Mujoco 환경을 학생용 계정으로 무료로 사용하는 방법에 대해 포스팅해보겠습니다. 😆 Mujoco는 중력이 작용하는 물리 엔진을 구현해서 만든 다양한 가상환경을 제공하는 소프트웨어로, 현실과 비슷한 환경이 필요한 강화학습 알고리즘을 연구 및 실험할 때 많이 사용됩니다. Mujoco 공식 사이트에서 데모 영상을 보실 수 있는데요, 언뜻 보아도 굉장히 정교하게 설계되었다는 느낌을 받았습니다. 자원이 많이 투입된 것으로 보이는데, 그런만큼 Mujoco는 개인/기업 모두 유료로 사용하도록 되어있습니다. 다만, 학생들에게는 교육 목적으로 무료 계정을 제공하고..
-
강화학습 개념부터 Deep Q Networks까지, 10분만에 훑어보기Reinforcement Learning/DQN 2019. 10. 28. 01:55
#강화학습 #Transfer Learning #DQN #DeepQNetworks #딥러닝 #MDP #MarkovDecisionProcesses 이 글은 원작자의 허락 하에 번역한 글입니다! 중간 중간 자연스러운 흐름을 위해 의역한 부분들이 있습니다. 원 의미를 왜곡시키지 않도록 노력하였지만, 부족한 부분이 분명 있을거라고 생각합니다. 어떤 지적이나 조언이든 해주신다면 감사히 받고 더 나은 글을 쓰기 위해 노력하겠습니다. 원문은 ↓ 이곳 ↓ 에서 보실 수 있습니다. Qrash Course: Reinforcement Learning 101 & Deep Q Networks in 10 Minutes Learn the basics of Reinforcement Learning and Deep Q Networks ..
-
CS234|1강. 강화학습 소개 & Sequential Decision MakingReinforcement Learning/CS234 Winter 2019 2019. 10. 4. 00:13
#CS234 #Stanford University #Emma Brunskill #강화학습 #MDP #POMDP 본 글은 Emma Brunskill 교수가 Stanford University에서 강의한 [2019 Winter CS234] 를 듣고 영어로 진행된 강의를 한국어로 이해해 보면서 풀어서 정리한 글입니다. 강의 자료 슬라이드는 여기 에서 받으실 수 있습니다. 글의 각 부분마다 ppt 위치를 표시하였습니다. Ⅰ. Overview of Reinforcement Learning # 강화학습의 정의 # 뇌와 지능의 의미 # 강화학습의 적용 # 강화학습의 개념 # 머신러닝과 강화학습의 비교 1. 한 문장으로 정의하는 강화학습 (ppt. 3-7) 1) "Learn to make good sequences o..
-
핸즈온머신러닝|Chap.1 한 눈에 보는 머신러닝Machine Learning|Deep Learning/Hands-On Machine Learning 2019. 5. 17. 16:42
# 핸즈온 머신러닝 ㅤ# Hands-On Machine Learning Chapter 1 연습문제에 대한 답을 정리하여 담았습니다. 책에 있는 내용, 또는 추가적으로 공부한 내용들로 구성하였습니다. ㅤ Keywords #머신러닝 #지도학습 #비지도학습 #강화학습 #분류 #회귀 #클러스터링 #군집 #배치학습 #미니배치학습 #모델파라미터 #하이퍼파라미터 #오버피팅 #언더피팅 #훈련데이터 #검증데이터 #테스트데이터 #교차검증 1. 머신러닝을 어떻게 정의할 수 있나요? 책에서 소개하는 머신러닝에 대한 일반적인 두 가지 정의는 다음과 같습니다. ㅤ [머신러닝]은 명시적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게 하는 연구분야다. (Arthur Samuel, 1959) ㅤ 어떤 작업 T에 대한 컴퓨터 프로그..