논문 리뷰
2023. 9. 7.
강화학습 논문 리뷰: Reward is Enough
[Abstract]해당 논문에서는 지식, 학습, 지각, 사회 지능, 언어, 일반화, 모방 등 지능과 관련된 능력들이 보상을 극대화하는 것에 종속되어 있다고 주장한다. 따라서 보상을 극대화하는 것만으로도 지능이 필요한 영역에서의 어떠한 행동을 유도하기에 충분하다는 의미에서 논문 제목이 Reward is Enough다. 이러한 측면을 통해 결국 강화학습을 통한 학습 방법이 General한 인공지능에 대한 해답이 될 수 있을 것이라고 논문에서는 주장한다. [Intro]이 논문에서는 "무엇이 에이전트(인간이든 RL이든)가 다양한 영역에서 현명하게 행동하도록 하나요?" 라는 질문에 "각각의 영역에서 그 능력을 이끌어내기 위해서 필요한 목표를 추구하는 것" 에서 발생한다는 것이라고 대답한다. 이러한 측면에서 본 논..