논문 리뷰
2022. 1. 18.
자율주행 논문 리뷰: Learning robust control policies for end-to-end autonomous driving from data-driven simulation
Author: Joonhee Lim Team: UNIST RML Date: 2022/01/18 0. Abstract 이 논문에서는 Sparse Rewards만을 이용하여 End to End 자율주행 Policy를 학습할 수 있는 Data 기반 시뮬레이션 및 엔진을 제시하였음. Sparse Rewards란 Episode 내에서 보상을 받는 경우가 굉장히 희박한 경우를 뜻합니다. -> Sparse Rewards일 때 초반 Replay Buffer를 쌓기 위해서 random policy로 transition을 수집하게 되면 학습에 악영향을 끼칠 수 있음(Random Policy로 Episode를 진행하면 Reward를 받는 경우가 거의 없기 때문에) * 이를 해결하기 위해 초반 학습단계에서는 최대한 dense..