- motion grammars for character animation, Eurographics, 2016
DL 쓰기 이전의 최신 논문
- DeepMind control suite, arxiv, 2018
D4PG(Distributed Distributional Deep Deterministic Policy Gradient) 제안, uniform reward [0,1], unsolvable or cheating(의도하지 않은 reward가 많이 보인다), 잘되는게 하나씩은 있다
- asynchronous methods for deep reinforcement learning, ICML, 2016
A3C를 사용하여 이전 논문들(Q-learning)에 비해 16CPU로 여러 GPU보다 더 빠른 병렬적 학습 가능, replay memory를 사용하지 않음
- high dimensional continuous control using generalized advantage estimation, ICLR, 2016
새로운 approach로 안정적인 학습을 할 수 있게한 논문이었던것 같다. 잘못된 설명을 할 것같아서 링크로 대체
https://reinforcement-learning-kr.github.io/2018/06/23/6_gae/
- space time planning with parameterized locomotion controllers
과도기적 논문, high level A* space-time plan + lower level RL controller (RL의 초기 접목 단계), Sergey Levine이 이때부터쯤 유명해졌다고 들은 듯 하다.
- continuous control with deep reinforcement learning, ICLR, 2016
DDPG를 소개한 논문?
여기 설명 너무 잘되있다;
https://talkingaboutme.tistory.com/983
[RL] Policy Gradient Algorithms
(해당 글은 OpenAI Engineer인 Lilian Weng의 포스트 내용을 원저자 동의하에 번역한 내용입니다.) Policy Gradient Algorithms Abstract: In this post, we are going to look deep into policy gradient, why it..
talkingaboutme.tistory.com
'DRL for computer graphics - 수업' 카테고리의 다른 글
RL 사용 전 방식의 옛날 논문 3가지 (0) | 2019.08.17 |
---|---|
PD controller (0) | 2018.05.30 |
카테고리 설명 (0) | 2018.05.30 |