[H-모빌리티 클래스 자율주행 판단 기초 내용 정리] 25. Reinforcement Learning 기반 경로생성 알고리즘 기초

1) 머신러닝은 지도학습, 비지도학습, 강화학습으로 분류

- 지도학습(supervised learning) : 레이블된 데이터로 학습

- 비지도학습(unsupervised learning) : 레이블 없이 학습/ 다차원 데이터를 많이 넣어서 데이터들끼리의 숨겨진 특징과 구조 발견

- 강화학습(reinforcement learning) : 보상을 많이 받는 쪽으로 점차적으로 시스템이 진화/ 의사결정을 위한 최적의 액션 선택 가능

1) 강화학습 동작 순서

1. 정의된 주체(agent)가 주어진 환경의 현재 상태를 관찰하여, 이를 기반으로 행동(action)을 취하게 됨

2. 환경의 상태가 변하면서 정의된 주체는 보상(reward)를 받게 됨

3. 보상을 기반으로 정의된 주체는 더 많은 보상을 얻을 수 있는 방향(best action)으로 행동을 학습함

2) 자율주행차에 적용?

- 주체 : 자율주행 차량

- 환경 : 주행환경으로 설정하여 주행 환경에 따라 특정 행동들에 대한 보상을 할당하는 방식으로 모델 구성

퀴즈)

1. 어떤 환경 안에서 정의된 주체가 현재의 상태를 관찰하여 선택할 수 있는 행동들 중에서 가장 최대의 보상을 가져다주는 행동이 무엇인지 학습하는 것은 무엇인가? 답 2

1. 지도학습

2. 강화학습

3. 머신러닝

4. 비지도학습

2. 강화학습 요소의 설명을 잘못 짝지은 것? 답 2(state 상태)

1. agent : 주체

2. state : 요소

3. action : 행동

4. reward : 보상

[H-모빌리티 클래스 자율주행 공통 내용 정리] 2. 자율주행 기술의 발전현황 (0)	2022.02.17
[H-모빌리티 클래스 자율주행 공통 내용 정리] 1. 자율주행 기술 5단계 개요 (0)	2022.02.17
[H-모빌리티 클래스 자율주행 판단 기초 내용 정리] 23. RRT 알고리즘 기초, 24. RRT 알고리즘 이해 (0)	2022.02.16
[H-모빌리티 클래스 자율주행 판단 기초 내용 정리] 21. A* 알고리즘 기초, 22. A* 알고리즘 이해 (0)	2022.02.16
[H-모빌리티 클래스 자율주행 판단 기초 내용 정리] 19. 자율주행 자동차의 경로생성 기술 개요, 20. 판단/경로생성에서의 주변환경 인식/자차 위치인식의 중요성 (0)	2022.02.16

3E daily script