Author: Joonhee Lim
Date: 2022/08/12
논문 원문: https://arxiv.org/ftp/arxiv/papers/2107/2107.01110.pdf
0. Abstract
자율주행 차량의 의사결정 방법들 중에서 학습 기반 방법들과 그에 대한 전망에 대해서 살펴보고자 한다.
차량 혹은 로봇의 Decision-Making에 대해 끊임없이 고민하는 필자이기에 현재 어떤 방법들이 연구되고 있는지 궁금해져 정리해보기로 하였다.
1. Introduction
먼저 자율 주행 차량의 의사 결정은 크게 1) High Level 의사 결정과 2) Low Level 의사 결정으로 나눌 수 있다.
- High Level 의사 결정이라 하면 차선 변경 상황에서 차선을 유지해야 한다! 혹은 왼쪽 차선으로 변경해야 한다! 와 같은 높은 수준의 의사결정이라고 보면 이해하기 편하고
- Low level 의사 결정이라 하면 차선을 유지하기 위해 혹은 변경하기 위해 어떤 Path로 혹은 어떤 제어를 통해 이동해야할 지 결정하는 과정이라고 생각하면 편하다.
일반적으로 의사 결정 방법은 고전적인 방법과 학습 기반 방법으로 나뉘며 각 방법에 대한 장단점을 비교해보고 분석해볼 예정이다.
2. THE OUTLINE OF DECISION-MAKING SYSTEM

A. Inputs and Outputs
의사결정을 위한 입력:
- 주변 환경 데이터(라이다, 카메라, 레이더을 통해 인식) Ex. static and dynamic objects, road information and traffic signs information.
- Ego 차량의 상태(GNSS/IMU을 통해 인식)
- HD Map(차선에 대한 정확한 정보를 제공할 수 있으며, 인식 정확도를 높이고 계산 비용을 절감 가능)
의사결정을 위한 출력:
- High-level 의사결정: 병합, 차선 변경, 유지
- Low-level 의사결정: 제어 명령(velocity, acceleration and angular velocity, acceleration)
B. The Design Criteria of Decision-Making System
의사결정 시스템이 고려해야하는 것
1. 실시간 성능(Real time Control이 가능한 지)
2. 주행 안전성과 효율성 사이의 균형(일반적으로 안전 우선 순위가 주행 효율보다 높음)
3. 합리적이고 정확한 의사 결정
4. 차량의 승차감(스티어링 안정성, 비상 브레이크 감소)
5. 고장 감지 능력
C. The Design Constrains of Decision-Making System
의사결정 시스템의 제약요인들
1. 주변 환경 정보: 다른 차량의 위치 및 속도, 보행자 및 차량 동작 예측, 도로에 놓이거나 떨어뜨린 정적 장애물, 도로 주행 가능 구역, 교통 및 도로 표지판
2. 교통 규정: 속도 제한, 유턴 가능한지, 주차 가능한 지
3. 차량의 상태: 위치, 속도, 향하는 방향, 현재 차선, 가려는 차선
4. 경로 계획 결과: 글로벌 경로 계획(맵 상에 경로를 만듦 계산도 많이함)과 로컬 경로 계획(현재 센서를 통해 짧은 경로를 계획 Ex. 충돌 회피)으로 나눌 수 있으며, 의사결정 과정은 현재 환경에서 로컬 경로 계획의 결과를 주로 고려합니다.
5. 과거의 의사결정 결과: 이전 몇 번의 순간에 자아 차량이 내린 역사적 결정들
6. 주행 윤리: 상향등 x, 보행자들에게 양보
3. REVIEW OF DECISION-MAKING METHODS
1) 고전 방식
Rule-Based:
- 장점: 해석가능성, 조정가능성, 넓은 의사결정 범위
- 단점: 복잡한 상황은 해결할 수 없음, 다양한 시나리오에 대한 강건함 부족
대표적으로 FSM(Finite State Machine)이 있다.

Optimization:
- 장점: 교통 참여자 간 상호작용을 잘 모델링할 수 있음
- 단점: 최적 전략에 대한 가정이 때때로 현실에선 맞지 않음
대표적으로 MPC(Model Predictive Control)가 있다.
#요즘에는 RL 또는 IRL과 같은 학습 기반 방식과 융합된 형태가 나오고 있다.
확률적 모델:
- 장점: 다른 유형의 방법론과 결합하기 용이함
- 단점: 복잡한 환경에서의 최적 의사결정 어려움, 낮은 연산 효율성
대표적으로 PGM(Probabilistic Graphical Model)가 있다.
2) 학습 기반 방식
통계적학습 기반:
- 장점: 다용도성, 충분한 정보와 함께면 간단한 시나리오에 적합
- 단점: 큰 데이터셋 요구, 낮은 의사 결정 정확도
대표적으로 SVM(Soft Vector Machien)이 있다.
심층학습 기반:
- 장점: 특정 시나리오에 대한 높은 의사 결정 정확도, 환경 정보의 완전 활용 보장(?)
- 단점: 많은 데이터셋 요구, 데이터셋에 의존함

강화학습 기반:
- 장점: 어려운 시나리오에 대응 가능, 확장 가능성
- 단점: 안정성 부족, Reward Function에 크게 의존

이 논문을 통해 기억해야할 점
1. 더 안전하고 편안한 시스템
2. 다양한 의사결정 방법의 퓨전
3. 복잡한 환경에 대한 Robust한 의사 결정
-> 다양한 방법 다 섞어버리자